[STT] open api로 stt 해보기

2023. 9. 26. 17:54python

https://aiopen.etri.re.kr/?currMenu=123&topMenu=101 

 

AI API/DATA

인공지능 기술을 체험할 수 있는 공공 인공지능 오픈 API·DATA 서비스 포털 과기부 R&D 과제를 통해 개발된 인공지능 결과물을 체험하고 연구에 활용할 수 있도록 제공

aiopen.etri.re.kr

openai STT API 사용해보기

 

API Key 발급 신청  -> 신청서 작성하기 -> API Key 확인

 

이메일& 비밀번호 입력하고 Api Key 확인하기 누르면 

발급 받은 키 번호가 나온다

키 번호 잘 복사 해두면 된다.

 

api 사용 방법은 여기 나와있다.

https://aiopen.etri.re.kr/guide/Recognition

 

AI API/DATA

JSON parsing을 위해 Gson 라이브러리를 사용하여 제공하고 있습니다. Gson 라이브러리에 대한 자세한 설명은 https://github.com/google/gson 에서 확인 하실 수 있습니다. import java.io.DataOutputStream; import java.i

aiopen.etri.re.kr

  #-*- coding:utf-8 -*-
  import urllib3
  import json
  import base64
  openApiURL = "http://aiopen.etri.re.kr:8000/WiseASR/Recognition"
  accessKey = "YOUR_ACCESS_KEY"
  audioFilePath = "AUDIO_FILE_PATH"
  languageCode = "LANGUAGE_CODE"
   
  file = open(audioFilePath, "rb")
  audioContents = base64.b64encode(file.read()).decode("utf8")
  file.close()
   
  requestJson = {    
      "argument": {
          "language_code": languageCode,
          "audio": audioContents
      }
  }
   
  http = urllib3.PoolManager()
  response = http.request(
      "POST",
      openApiURL,
      headers={"Content-Type": "application/json; charset=UTF-8","Authorization": accessKey},
      body=json.dumps(requestJson)
  )
   
  print("[responseCode] " + str(response.status))
  print("[responBody]")
  print(str(response.data,"utf-8"))

accessKey에 발급받은 번호 입력, 

audioFilePath에 오디오 파일 경로 입력하고,

languageCode='korean' 다른 언어로 할거면 옵션 바꿔주면 된다. 사이트에 잘 나와있음

 

성능이 꽤나 괜찮다. 애매한 음성도 잘 변환해줌

돈 내고 쓰는 api 보다 좋은듯하다.