Instal·lació d'Apache Pig a Linux

Aquest bloc és una guia pas a pas per a la instal·lació d'Apache Pig a l'entorn Linux. Instal·larem Apache Pig 0.16.0 i l'executarem en diferents modes.

En aquest post, en parlaré Instal·lació d’Apache Pig a Linux . Comencem amb la definició bàsica d’Apache Pig i Pig Latin.



Porc Apatxe és una eina / plataforma per crear i executar el programa Map Reduce utilitzat amb Hadoop. És una eina / plataforma per analitzar grans conjunts de dades. Es pot dir que Apache Pig és una abstracció de MapReduce. Els programadors que no són tan bons a Java solien lluitar treballant a Hadoop, principalment mentre escrivien feines MapReduce.Per tant, és un tema important per aprendre i dominar .Apache Pig té el seu propi llenguatge Llatí porcí cosa que és una gran ajuda per als programadors pobres.



Una introducció bàsica a Pig Latin us ajudarà a entendre millor:

Es diu el llenguatge procedimental d’alt nivell utilitzat a la plataforma Apache Pig Llatí porcí . Apache Pig presenta 'Pig Latin', que és un llenguatge relativament més senzill que pot executar-se mitjançant conjunts de dades distribuïts al sistema de fitxers Hadoop (HDFS). A Apache Pig, heu d’escriure scripts Pig utilitzant el llenguatge Pig Latin, que es converteix en una feina MapReduce quan executeu l’escriptura Pig. Apache Pig té diversos operadors que s’utilitzen per realitzar tasques com llegir, escriure, processar les dades. Per obtenir informació sobre els operadors d’Apache Pig, aneu al nostre blog “ Operadors d'Apache Pig: primera part: operadors relacionals '.

Ara que ja teniu coneixement bàsic d'Apache Pig, comencem amb la instal·lació d'Apache Pig a Linux.



Instal·lació d'Apache Pig a Linux:

A continuació es mostren els passos per a la instal·lació d’Apache Pig a Linux (ubuntu / centos / windows amb Linux VM). Estic fent servir Ubuntu 16.04 a la configuració següent.

Pas 1: descarregar Porcí quitrà dossier.

Comandament: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Descàrrega Pig - Pig Installation - Edureka

com convertir un doble a un int java

Pas 2: Extraieu el fitxer quitrà fitxer mitjançant l'ordre tar. A sota de l'ordre tar, x significa extreure un fitxer d'arxiu, amb significa filtrar un arxiu mitjançant gzip, f significa el nom d'un fitxer d'arxiu.

Comandament: tar -xzf pig-0.16.0.tar.gz

Comandament: ls

Pas 3: Editeu el text ' .bashrc ”Per actualitzar les variables d’entorn d’Apache Pig. Ho estem configurant perquè puguem accedir a pig des de qualsevol directori, no cal que anem al directori pig per executar ordres pig. A més, si alguna altra aplicació està buscant Pig, coneixerà el camí d'Apache Pig des d'aquest fitxer.

Comandament: sudo gedit .bashrc

Afegiu el següent al final del fitxer:

# Estableix PIG_HOME

export PIG_HOME = / home / edureka / pig-0.16.0
exporta PATH = $ PATH: /home/edureka/pig-0.16.0/bin
exportació PIG_CLASSPATH = $ HADOOP_CONF_DIR

A més, assegureu-vos que el camí hadoop també estigui definit.

Executeu l'ordre següent perquè els canvis s'actualitzin al mateix terminal.

Comandament: font .bashrc

Pas 4: Consulteu la versió del porc. Es tracta de comprovar que Apache Pig s’ha instal·lat correctament. En cas que no obtingueu la versió d’Apache Pig, heu de verificar si heu seguit correctament els passos anteriors.

Comandament: porc -versió

Pas 5 :Consulteu l'ajuda del porc per veure totes les opcions d'ordres del porc.

Comandament: porc -ajudar

Pas 6 :Executeu Pig per iniciar la closca grunyida. Grunt shell s’utilitza per executar scripts Pig Latin.

Comandament: porc

Si mireu correctament la imatge anterior, Apache Pig té dos modes en què es pot executar; per defecte, tria el mode MapReduce. L'altre mode en què podeu executar Pig és el mode Local. Deixeu-me que us expliqui més sobre això.

Modes d'execució en Apache Pig:

  • Mode MapReduce - Aquest és el mode per defecte, que requereix accés a una instal·lació de clúster Hadoop i HDFS. Com que aquest és un mode per defecte, no cal especificar el senyalador -x (es pot executar porc O porc -x mapreduce ). L'entrada i la sortida en aquest mode estan presents a HDFS.
  • Mode local - Amb accés a una sola màquina, tots els fitxers s’instal·len i s’executen mitjançant un sistema local i un sistema de fitxers. Aquí s’especifica el mode local mitjançant ‘-x flag’ ( porc -x local ). L'entrada i sortida en aquest mode estan presents al sistema de fitxers local.

Comandament: porc -x local

Podeu veure el següent vídeo per veure la instal·lació d’Apache Pig a Linux:

Instal·lació d'Apache Pig | Instal·lació de Pig a Linux | Edureka

Ara que heu acabat la instal·lació d'Apache Pig a Linux, el següent pas endavant és provar alguns operadors relacionats de Pig a l'intèrpret d'ordres Pig Grunt. Per tant, el proper bloc ' Operadors d'Apache Pig: primera part: operadors relacionals ”Us ajudarà a dominar els operadors de Pig.

Ara que heu instal·lat Apache Pig a Linux, consulteu el fitxer per Edureka, una empresa d'aprenentatge en línia de confiança amb una xarxa de més de 250.000 estudiants satisfets repartits per tot el món. El curs de formació en certificació Edureka Big Data Hadoop ajuda els estudiants a convertir-se en experts en HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume i Sqoop mitjançant casos d’ús en temps real en dominis Retail, Social Media, Aviació, Turisme, Finances

Tens alguna pregunta? Esmenta’l a la secció de comentaris i et respondrem.