VoiceClear-M

TRACK 02 · HARDWARE

현장 무전의 잡음을 걷어내는 칩

전장 무전 환경은 포격(150~180dB)·엔진 소음(120~140dB)·동시발화 같은 극한 조건입니다. 일반 음성 인식 모델의 인식률이 급격히 떨어지는 영역에서, VoiceClear-M은 보드 위에서 직접 음성을 정제합니다.

DGX 워크스테이션에서 학습한 Teacher 모델을 Tiny CNN Student로 압축해 MAX78000 보드에 이식하는 방식입니다. 칩 범위는 KWS·VAD·소음 분류·간단한 노이즈 억제 보조로 한정 — 한국어 STT/LLM 전체 처리가 아닙니다.

DEPLOYMENT · 운영 환경

APPROACH · 모델 경량화 흐름

STAGE 01

DGX Teacher

DGX Spark 워크스테이션에서 풀 사이즈 음성 정제 모델 학습. 군 소음·공장 프레스·호각음·일반 음성 혼합 데이터셋.

STAGE 02

Tiny CNN Student

Teacher 출력 분포 기반 distillation으로 300~400K 파라미터 Tiny Conv-TasNet baseline 학습. PESQ·STOI 측정.

STAGE 03

MAX78000 PoC

Maxim ai8x-training/synthesis 환경에서 INT8 양자화 → KWS20 데모 빌드 → 실시간성·전력 측정. MAX78002 보강 검토 병행.

DELIVERY · 산출물

제품명

VoiceClear-M

산출물

DSP 펌웨어 + AI 칩 모듈 (HW)

출력 형태

정제된 음성 (audio)

타깃 시장

무전기 부품 (HW) · 군용·산업 무전 환경

K-방산 사업과 구분

GCS Shaker(K-방산 1단계 · SW)와 산출물·시장이 명확히 구분되어 중복지원 미해당. 두 제품은 독립 운용 가능하며 결합 시 시너지(음성 정제 → KWS).

RECENT · 최근 활동

2026.05.21 · MEETING

MAX78000 펌웨어 미팅 — Teacher / Student 합의

보드 오디오 path 안정화 우선. DGX Teacher → Tiny CNN Student → 보드 PoC 흐름 합의. MAX78002 보강 검토 병행. 칩 범위는 KWS·VAD·소음 분류 보조로 한정 표기.