TensorFlow.js: Speech Command Recognizer (번역)

TensorFlow.js의 공식 모델 중 하나인 Speech command recognition에 대해 조사해 보았습니다.

원문 링크: tfjs-models/speech-commands at master · tensorflow/tfjs-models · GitHub

  • 작은 어휘(small vocabulary)에서 분리된 간단한 영단어로 구성된 음성 명령을 인식할 수 있는 자바스크립트 모듈이다.

  • Default vocabulary는
    • “zero”에서 “nine”까지의 10개 숫자,
    • “up”, “down”, “left”, “right”, “go”, “stop”, “yes”, “no”,
    • 그리고 “unknown word”와 “background noise” 분류를 포함한다.
  • 이 Speech command recognizer는 웹 브라우저의 Web Audio API를 이용한다. TensorFlow.js의 상위에 빌드되어 있으며 추론(inference) 및 transfer learning을 온전히 브라우저 내에서 수행할 수 있는데, WebGL GPU acceleration을 사용한다.

  • 기저에 깔려 있는 deep neural network는 TensorFlow Speech Commands Dataset을 이용해 훈련되었다.
    • Core words (20개, 대부분의 speaker가 다음의 단어를 5번씩 녹음하였음)

      • “Yes”, “No”, “Up”, “Down”, “Left”, “Right”, “On”, “Off”, “Stop”, “Go”, “Zero”, “One”, “Two”, “Three”, “Four”, “Five”, “Six”, “Seven”, “Eight”, and “Nine”
    • Auxiliary words (10개, 대부분의 speaker가 다음의 단어를 1번씩 녹음하였음)
      • “Bed”, “Bird”, “Cat”, “Dog”, “Happy”, “House”, “Marvin”, “Sheila”, “Tree”, and “Wow”
    • More details on the dataset:
  • 이 API를 이용해 1. 실시간 스트리밍(오디오 input) 인식2. 오프라인 인식이 가능하다.
    • 자세한 API 사용법은 여기를 참고

2019

Redis 기초 특강 - 강대명 멘토

1 minute read

Redis 소개 In-memory data structure storage disk 접근을 하지 않음 -> 속도가 빠르다 오픈소스(BSD 3) 제공되는 자료구조들 Strings, set, sorted-set, ...

Node.js 특강 - 손영수 멘토 (2)

3 minute read

MongoDB 클라우드 서비스를 SaaS로 제공하려다가 그 중 DB 서비스가 제일 잘 나가서 MongoDB가 됨 No Schema: JSON data 삽입 시 field가 생성됨 Document data model JSON data를 그대로 넣음 ...

Node.js 특강 - 손영수 멘토 (1)

3 minute read

웹 서버의 구동 방식에는 8가지가 있음(3페이지) Node.js는 비동기, non-blocking Server side Javascript Event driven Asynchronous Non-Blocking I/O ...

TensorFlow.js: Speech Command Recognizer (번역)

less than 1 minute read

TensorFlow.js의 공식 모델 중 하나인 Speech command recognition에 대해 조사해 보았습니다. 원문 링크: tfjs-models/speech-commands at master · tensorflow/tfjs-models · GitHub

Chapter 04. HTML & CSS 필수 기초 (2)

2 minute read

이 포스트는 SW마에스트로 자기주도학습으로 패스트캠퍼스의 웹 프론트엔드 올인원 패키지 Online을 수강하면서 작성한 노트입니다.

Chapter 04. HTML & CSS 필수 기초 (1)

1 minute read

이 포스트는 SW마에스트로 자기주도학습으로 패스트캠퍼스의 웹 프론트엔드 올인원 패키지 Online을 수강하면서 작성한 노트입니다.

Chapter 03. CSS 입문

1 minute read

이 포스트는 SW마에스트로 자기주도학습으로 패스트캠퍼스의 웹 프론트엔드 올인원 패키지 Online을 수강하면서 작성한 노트입니다.

CC 라이센스

less than 1 minute read

소프트웨어 마에스트로 과정에서 아기 울음소리를 인식하고 분류하는 딥러닝 모델을 작성하고 있습니다. GitHub에 공개되어 있는 소리 데이터셋을 사용하기 위해 확인한 라이센스 몇 가지를 정리해 보았습니다. 참고한 곳: CC 라이선스 :: Creative Commons K...

URI와 URL의 차이점

less than 1 minute read

이 포스트는 What Is The Difference Between A URI And A URL? - DEV Community 👩‍💻👨‍💻 를 참고하여 작성되었습니다.

Chapter 02. HTML 입문

1 minute read

이 포스트는 SW마에스트로 자기주도학습으로 패스트캠퍼스의 웹 프론트엔드 올인원 패키지 Online을 수강하면서 작성한 노트입니다.

블로그 개설

less than 1 minute read

Github 블로그를 드디어 개설했습니다.🎉

Back to Top ↑