Apache Nifi - Kafka to HBase
·
DataPipeline/Nifi
[ 아키텍처 ]Kafka -> Nifi -> HBase -> Python으로 데이터 Fetch   [ Kafka ]카프카의 토픽명과 컨슈머그룹명을 정해 데이터를 받는다.  [ Nifi ]아래와 같은 프로세스 플로우로 구성할 수 있다. ConsumerKafka에 토픽명과 그룹명을 설정값으로 입력한다UpdateAttribue와 ReplaceText는 해당 데이터가 나이파이에 적제되는 시간을 입력하기 위함이므로 생략가능하다.PutHBaseJson에 HBase TableName, Row Identifier, Column Family값을 입력한다.네임스페이스가 있다면 NS:TableName과 값이 입력한다.Row Identifier값은 로우키가 되므로 유니크한 값으로 설정한다. 예시에선 $(createdAt}_$..
Apache HBase - 설치[ Install ]
·
Storage/Hbase
[ 필요조건 ] 1. Java가 설치되어있어야 함 [root@hadoop01 ~]# java -version openjdk version "1.8.0_252" 2. Hadoop이 설치되어있어야 함 [root@hadoop01 ~]# hadoop version Hadoop 3.2.1 ...... 3. 경로 환경설정 [root@hadoop01 ~]# vi /etc/profile ...맨 밑줄에 export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.252.b09-2.el7_8.x86_64 export HADOOP_HOME=/usr/local/hadoop/hadoop-3.2.1 export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$..
Apache HBase - 개요 및 아키텍처
·
Storage/Hbase
1. Hbase의 등장 하둡은 MapReduce를 이용하여 대용량 데이터를 저장하고 처리하는데는 탁월하다. 그러나 데이터를 순차적방식으로 액세스하여, 간단한 작업을 할 때에도 해당 데이터를 찾을 때 까지 데이터 집합 전체를 검색해야 한다. 이러한 불편함을 개선하기 위해 Random Access Database를 개발하였는데 HBase, Cassandra, couchDB, Dynamo, MongoDB와 같은 데이터베이스이다. 2. HBase란 [ 컬럼지향데이터베이스 ] HBase는 HDFS(Hadoop Distributed File System)위에 구축된 분산형 컬럼지향 데이터베이스이다. ROW기반의 RDBMS보다 데이터를 통계화 하는데 이점이 있다. [ 이미지참조 http://www.dbguide.ne..
wave35
'Hbase' 태그의 글 목록