개요
- Sqoop은 SQL to Hadoop의 약어입니다.
- 관계형 데이터베이스와 Hadoop 간 데이터 이관을 지원하는 툴입니다.
- RDB와 Hadoop 간 대량 데이터 전송이 가능합니다.
- Sqoop을 사용하면 RDB 데이터를 "HDFS, 하이브, Hbase"에 Import/Export할 수 있습니다.
- 클라우데라에서 개발하였고, 아파치 오픈소스 프로젝트로 공개되었습니다.
아키텍처
- RDB를 읽고 쓸 수 있는 "커넥터"라는 개념을 사용합니다.
- 커넥터는 각 DB별로 구현되어 있습니다.
- JDBC 드라이버를 사용해 DB접속 및 쿼리 실행을 요청합니다.
참고자료
https://excelsior-cjh.tistory.com/56
https://tomining.tistory.com/54
https://docs.ncloud.com/ko/hadoop/chadoop-4-1.html
2019년 1월 24일 목요일
피드 구독하기:
댓글 (Atom)
[Network] DMZ의 정의
DMZ (De-Militarized Zone) - 보안을 위하여 내부/외부 네트워크를 분리할 때, 외부로 서비스는 제공 하면서 내부의 보안을 유지 하기 위한 방법입니다. - 내부망과 외부망 사이에 위치한 네트워크입니다. ...
-
서버 원격 접속 시 보안을 위하여 클립보드 사용을 제어할 수 있습니다. > 로컬 그룹 정책 편집기 > 컴퓨터 구성 > 관리 템플릿 > Windows 구성 요소 > 터미널 서비스 > 원격 테스트톱 세션 호스트...
-
세션 - 프로세스는 프로세스를 시작시킨 사용자에게 속하며, 세션에 속합니다. - 세션은 프로세스, 윈도우, 윈도우 스테이션, 데스크탑, 여러 리소스들을 포함합니다. - 프로세스는 1개 세션에 속하고 각 세션은 세션 ID를 가지고 있습니다. - ...
-
개요 - HP에서 만든 임베디드 서버관리 기술입니다. - 기본 NIC 외 물리적 이더넷 포트를 사용하여 원격지에서 HP 서버 활동을 수행합니다. - ProLiant 서버 사용자에게 제공되며, 원격 접속 포트로 시스템에 접속합니다. - 시스템 앞...
댓글 없음:
댓글 쓰기