Joyent의 만타 (Manta): 저장하고 계산하다

By gamlerhart February 11, 2017 Technical Wibbly Wobbly, 한국어 배우기

(English version will come out, probably tomorrow =) )
이제까지 우리는 Joyent의 Triton 사용했어요. 트리툰으로 Docker 컨테이너를 배포했어요. 아마 데이터를 저장하고 싶어요. 만타는 아마존 S3 같은 스토리지 서비스예요. 근데 만다는 계산도 할 수 있어요. 시작하자!

저장만 할 수 있으면 데이터를 항상 전송해야 돼요

만타 계산할 수 있어서 데이데이터 전송 필요 없어요.

준비하자!

만다는 (Manta) REST-API가 있어요. 근데 우리는 이 블로그 글에 만타의 앱을 사용할 거예요. npm로 설치하세요:

그리고 우리는 만타 환경을 준비해야 돼요. 만타 웹 사이트에서 복사하세요:

지금 다 준비됐어요!

파일들을 저장하자

우리는 먼저 파일을 몆게 업로드하세요.

`mput`로 업로드해요. `-f`는 이 파일 업로드해요. `~~/stor/hello-manta.txt`는 만타의 파일 어디에 저장해요. `~~’는 unix 같은 사용자의 폴더가 뜻이에요. 그리고 `mget`로 파일 다시 다운로드할 수 있어요. `mput`는 유닉스 파이프로 다 업로드할 수 있어요. 여기에 우리는 RFC-문서 업로드해요. `-p`는 폴더가 아직 없으면 새로운 폴더 만들 거예요. `mls` 플더를 명부하고 `mfind`로 파일을 이름으로 찾을 수 있어요. 그리고 `mrm` 파일을 삭제해요.

만타의 비밀은: 계산

우리는 먼저 영화 몇게 업로드할게요.

그럼 이 파일일 만타에서 저장했어요. 아마 핸드폰 위해 작은 비디오 파일 좋겠다. 그래서 우리는 비디오 다운 받고 트랜스 코드 하고 업로드할까요?
이 파일 몇GB 크면 다운 받고 다시 업로드할까요? 아니요! 만타는 계산할 수 있어서 우리는 만타에 트랜스 코드할 수 있어요.
아, 그래서 우리는 새로운 프레임워크(framework) 배워야 돼요? 아니요! 만타는 그냥 보통 유닉스 프로그램 사용해요! 시작하자!

우리는 `mlogin`로 이 파일을 연락해요. 진짜요. 이렇게 파일 옆에서 모은 유닉스 프로그램 사용하고 모은 계산할 수 있어요. 우리는 작은 비디오를 만들고 싶어서 ‘ffmpeg’ 사용해봐요. 그데 우니는 모든 비디오를 트렌수 코드 하고 싶어요. 그래요! `mjob`로 사용 시작해요.

`mjob`는 만터 파일 경로를 `stdin`로 받아요. `mjob create`가 새로운 계산 시작해요. `-o`를 사용 하면 계산 끝날 때 결과를 생길을 거예요. 그리고 `-m`후에 계산 있어요.
1번 예: `~~/stor/blog/caminandes_03.mp4′ 파일의 `sha1` 계산해요.
2번 예: `mfind`로 모든 파일 찾고 파일의 `sha1` 계산해요.
3번 예: 우리가 유닉스 파이프 사용할 수 있어요. 그래서 잘 읽을 수 있는 줄 만들어요.

그럼 유용한 계산 해봐요. caminandes_01.zip하고 caminandes_02.zip 파일 `unzip`로 열고 `mpipe`로 새로운 만타 파일을 저장해요. `-w`가 계산의 끝을 기다려요.
그리고 이제 작은 핸드폰의 비디오 만들 수 있어요. `ffmpeg`로 트렌수 쿠딩 하고 mpipe로 파일을 저장해요. 타다~~~~! 작은 비디오 있어요. `mget`로 다운 받으세요.
이건 다 만타로 했어요. 이 파일들 크면 아무것도 다운 받지 않고 저기에, 만타에 계산했어요. 대박!

맵리듀스

이제까지 우리는 `mjob -m`만 사용했어요. `mjob`가 맵리듀스 할 수 있어요. 개요를 만들고 싶으면 맵리듀스 할 수 있어요. 예를 보일 거예요. 모든 비디오의 비트 전송속도 통계 해요:

# Let's list the bit rate: # First find the bitrate: ffprobe $MANTA_INPUT_FILE 2>&1 # Find the bitrate line: grep bitrate mfind -n mp4$ ~~/stor/blog | mjob create -o -m 'ffprobe $MANTA_INPUT_FILE 2>&1 | grep bitrate' #=> added 6 inputs to 00abc11b-2bad-405c-8add-941400614cc4 #=> Duration: 00:02:26.05, start: 0.000000, bitrate: 6900 kb/s #=> Duration: 00:02:30.13, start: 0.000000, bitrate: 10680 kb/s #=> Duration: 00:02:30.12, start: 0.021333, bitrate: 717 kb/s #=> Duration: 00:01:30.02, start: 0.023220, bitrate: 672 kb/s #=> Duration: 00:02:26.08, start: 0.021333, bitrate: 725 kb/s #=> Duration: 00:01:30.00, start: 0.000000, bitrate: 3120 kb/s # Let's list the bit rate again: # Only extract the bit rate colum: awk "{print \$6}" mfind -n mp4$ ~~/stor/blog | mjob create -o -m 'ffprobe $MANTA_INPUT_FILE 2>&1 | grep bitrate | awk "{print \$6}"' #=> added 6 inputs to 6c1b8b80-1516-e8e5-f6b6-99c5ebcd9f3b #=> 6900 #=> 672 #=> 10680 #=> 717 #=> 725 #=> 3120 # With the reduce phase we can collect the result's back together. # For example, get the min, max and mean bit reate of all our videos mfind -n mp4$ ~~/stor/blog | mjob create -o -m 'ffprobe $MANTA_INPUT_FILE 2>&1 | grep bitrate | awk "{print \$6}"' \ -r 'maggr max,min,mean'

먼저 `mjob`로 비디오 전송속도 받아요. `ffprobe`가 비디오의 정보의 받고 `grep`로 bitrate를 찾고 `awk`로 bitrate의 6열 받아요. 마지막, `-r’후에 리듀스 있어요. 여기에 `maggr‘로 통계 해요. (ㅅ_ㅅ)

만타 탐색해주세요

저는 많은 주제 빼었어요. 만타의 안내 보고 탐색해주세요. =)

Tagged on: containers, joyent, manta

Gamlor

thoughts about programming, tv-series and other geeky stuff.