일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- pandas
- 졸프
- react native
- Spring
- Expo
- JPA
- @Transactional
- google cloud
- yolo
- matplotlib
- 양방향 매핑
- Spring Boot
- html
- C++
- idToken
- Loss Function
- OG tag
- google login
- javascript
- google 로그인
- marksense.ai
- skt fellowship 3기
- 코드업
- 커스텀 데이터 학습
- STT
- 2021 제9회 문화공공데이터 활용경진대회
- 순환참조
- YOLOv5
- AWS
- oauth
- Today
- Total
목록STT (4)
민팽로그

스트리밍 방식 음성 인식 으악!!!!! 암튼 마지막 스트리밍 방식 예제 코드를 돌려보았다. import com.google.api.gax.rpc.ClientStream; import com.google.api.gax.rpc.ResponseObserver; import com.google.api.gax.rpc.StreamController; import com.google.cloud.speech.v1.*; import com.google.protobuf.ByteString; import java.util.ArrayList; import javax.sound.sampled.AudioFormat; import javax.sound.sampled.AudioInputStream; import javax.sound..

비동기식 음성 인식 1분 이상의 긴 음성 파일을 텍스트로 변환하는 비동기식 인식을 하는 김에 time stamp 기능을 함께 사용해보았다. time stamp는 단어와 단어 사이의 간격을 인식하여 문장 내에서 단어를 분리하고, 각 단어가 몇초에 시작하여 몇초에 끝나는지 시간 정보를 도장찍듯 출력할 수 있는 기능이다. 이번에는 그냥 gcs에 있는 파일을 사용하였고 구글 stt 문서에서 제공하는 예제코드를 거의 수정없이 사용하였다. import com.google.api.gax.longrunning.OperationFuture; import com.google.cloud.speech.v1.LongRunningRecognizeMetadata; import com.google.cloud.speech.v1.Lon..

동기식 음성 인식 동기식 짧은 음성파일(wav파일)을 2가지 방법으로 텍스트로 바꾸어 보았다. 두 방식 모두 큰 차이는 없다. 우선 다시 언급하자면 구글 stt 음성인식 방법으로는 크게 동기, 비동기, 스트리밍 방식이 있고, 오늘 사용할 동기식 음성인식은 1분 미만의 짧은 음성 파일을 텍스트로 변환하는데에 사용한다. 주의할 점: RecognitionConfig 과정이 텍스트 변환에 상당한 영향을 끼친다. 내가 녹음한 파일의 확장자는 m4a 였고, wav로 변환하는 과정에서 sampling rate와 채널 수를 확실하게 하기 위해 오디오 파일 변환 도구를 사용했다. 특히 sampling rate가 일치하지 않을때 텍스트로 변환이 안됐는데 오류메세지가 뜨지 않을 수도 있다. 1. local파일 동기 ..
Speech-to-Text Google AI 기술로 지원되는 API를 사용하여 음성을 텍스트로 정확하게 변환 아래 사이트에서 사용방법 참고 https://cloud.google.com/speech-to-text?hl=ko Speech-to-Text: 자동 음성 인식 | Google Cloud 쉽게 사용 가능한 API로 Google의 강력한 머신러닝 모델을 적용하여 125개 이상의 언어 및 방언으로 된 음성을 텍스트로 정확하게 변환할 수 있습니다. cloud.google.com 클라이언트 라이브러리를 사용하여 JAVA로 음성인식 요청을 보내는 방법을 택했고 Eclipse와 Maven을 사용한다. 우선 간단한 사용환경 설정 과정은 아래와 같다. 1. Cloud Console 프로젝트를 설정 프로젝트를..