A4AIKorea Sovereign DIP
군용 엣지 서버에 연결되는 VoiceClear-M 칩셋
TRACK 02 · HARDWARE

현장 무전의 잡음을 걷어내는

전장 무전 환경은 포격(150~180dB)·엔진 소음(120~140dB)·동시발화 같은 극한 조건입니다. 일반 음성 인식 모델의 인식률이 급격히 떨어지는 영역에서, VoiceClear-M은 보드 위에서 직접 음성을 정제합니다.

DGX 워크스테이션에서 학습한 Teacher 모델을 Tiny CNN Student로 압축해 MAX78000 보드에 이식하는 방식입니다. 칩 범위는 KWS·VAD·소음 분류·간단한 노이즈 억제 보조로 한정 — 한국어 STT/LLM 전체 처리가 아닙니다.

DEPLOYMENT · 운영 환경

폐쇄망 엣지 운용

군용 엣지 서버 인터페이스
EDGE · DEPLOY
엣지 디바이스 직접 배치
현장 무전 입력에 직접 칩셋 결합. 서버 전송 없이 즉시 정제.
폐쇄망 엣지 서버 랙
SECURE · ON-PREM
폐쇄망 단독 운용
클라우드 의존 0. 군 망분리 환경에서 보안 인증 통과.
저전력 엣지 모듈
LOW POWER
저전력 추론 (25W 이하)
배터리 연동 야외 운용. 50~80W 대비 절반 이하 소비전력.
APPROACH · 모델 경량화 흐름

Teacher → Student → PoC

STAGE 01
DGX Teacher

DGX Spark 워크스테이션에서 풀 사이즈 음성 정제 모델 학습. 군 소음·공장 프레스·호각음·일반 음성 혼합 데이터셋.

STAGE 02
Tiny CNN Student

Teacher 출력 분포 기반 distillation으로 300~400K 파라미터 Tiny Conv-TasNet baseline 학습. PESQ·STOI 측정.

STAGE 03
MAX78000 PoC

Maxim ai8x-training/synthesis 환경에서 INT8 양자화 → KWS20 데모 빌드 → 실시간성·전력 측정. MAX78002 보강 검토 병행.

DELIVERY · 산출물

출력 형태와 타깃 시장

제품명
VoiceClear-M
산출물
DSP 펌웨어 + AI 칩 모듈 (HW)
출력 형태
정제된 음성 (audio)
타깃 시장
무전기 부품 (HW) · 군용·산업 무전 환경
K-방산 사업과 구분
GCS Shaker(K-방산 1단계 · SW)와 산출물·시장이 명확히 구분되어 중복지원 미해당. 두 제품은 독립 운용 가능하며 결합 시 시너지(음성 정제 → KWS).
RECENT · 최근 활동

최근 운영 신호

2026.05.21 · MEETING
MAX78000 펌웨어 미팅 — Teacher / Student 합의
보드 오디오 path 안정화 우선. DGX Teacher → Tiny CNN Student → 보드 PoC 흐름 합의. MAX78002 보강 검토 병행. 칩 범위는 KWS·VAD·소음 분류 보조로 한정 표기.