0. 들어가기
회의에서 음성녹음을 한 뒤 ChatGPT에게 회의록을 작성해달라고 하려 했는데, SST(Speach To Text)는 구현이 안되어있는듯하다.
그래서 ChatGPT의 추천대로 OpenAI인 Whisper를 이용하여 텍스트를 구한 뒤, 회의록을 작성해달라고 해보자.
1. Whisper 설치
파이썬은 3.10 이상이 설치되어있다는 가정하에 진행한다.
아래 코드 입력
pip install git+https://github.com/openai/whisper.git
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
2. ffmpeg 설치
ffmpeg란 동영상관련 툴인데, whisper가 오디오 작업을 ffmpeg로 하는 듯 하다.
먼저 아래 링크로 들어가 "ffmpeg-release-essentials.zip"를 다운로드한 뒤 압축을 풀고 bin폴더를 환경변수 PATH에 추가한다.
https://www.gyan.dev/ffmpeg/builds/
3. whisper 명령어 실행
아래 명령어를 실행한다. 첫 실행이라면 Korean모델에 대한 다운로드가 진행된다.
python -m whisper "회의.m4a" --model medium --language Korean
4. ChatGPT 해줘
Whisper에서 구한 텍스트를 ChatGPT한테 주면서 요약해달라고한다.
반응형
'프로그래밍 > Python' 카테고리의 다른 글
[Python] 파일명 일괄 변경 (0) | 2023.08.20 |
---|---|
[Python] argparse를 이용한 파이썬 실행 시 매개변수 받기 (0) | 2023.03.18 |
[Python] 파이썬 실행 시 매개변수 전달 (0) | 2023.03.18 |
[Python] 문장(String)에서 리스트 단어 찾기 (0) | 2022.12.08 |
[Python] 딕셔너리 리스트 특정 속성이 최대값/최소값 불러오기 (0) | 2022.12.08 |
댓글