소프트웨어·플러그인

머신 러닝 알고리즘으로 구현된 Accentize의 리얼타임 노이즈 제거기 ‘VoiceGate’ 발매

뮤직텔레그래프 2020. 3. 25. 13:30

독일 Accentize사의 머신 러닝 테크닉을 통해 스피치나 보컬 레코딩에서 발생하는 다양한 종류의 노이즈를 실시간으로 분석하여 보다 정밀하고 빠르게 제거할 있다.



보이스게이트(VoiceGate) 메인 화면



머신 러닝(machine learning) 분야의 최근 발전은 우리가 데이터를 다루고, 이해하고, 처리하는 방식을 변화시켰다. 새로운 이론적 통찰력, 자유롭게 사용할 있는 프로그래밍 라이브러리의 증가, 컴퓨팅 리소스에 대한 액세스 증가로 인해 데이터 처리 문제를 다른 각도에서 해결할 있는 새로운 가능성이 대두되었다. Accentize사는 최첨단 머신 러닝 이론을 오디오 신호 처리 영역에 적용하는 중점을 두고, 최첨단 연구와 그것의 생산 구현 사이의 격차를 해소해 왔다. 새로 출시된 Accentize사의 ‘VoiceGate' 플러그인을 사용하면 스피치 보컬 녹음에서 발생 가능한 거의 모든 노이즈를 쉽고 자동화된 방식으로 처리할 있다.




'VoiceGate' 인간의 스피치(speech) 분석하는 특수 훈련 인공 신경망(artificial neural network) 하에서 작동하는 실시간 노이즈 제거기(real-time noise reducer)입니다. 인공 신경망과 같은 머신 러닝 기술의 도움으로 ‘VoiceGate' 알고리즘은 음성신호 구성 요소 필요한 부분과 필요치 않은 노이즈를 쉽게 구별하여 처리할 있습니다. ‘VoiceGate’ 적용된 인공 신경망은 100시간이 넘는 오디오 데이터를 통해 인간의 스피치 특성을 학습하도록 훈련되어 왔습니다.







VoiceGate 엔진의 개요

‘VoiceGate’ ‘Steady Noise’ ‘Impulsive Noise’ 가지 유형으로 일반적인 노이즈를 감지하도록 설계되었습니다. 이러한 노이즈 검출 개념 하에서, Steady Noise 화이트 혹은 핑크 노이즈와 같이 시간이 지남에도 음량값이 크게 변동하지 않는 고정적이고 일정한 소음을 의미합니다. 반면에 Impulsive Noise 클릭(click)이나 (pop) 노이즈와 같이 시간에 따라 예기치 않게 발생하는 일시적이고 즉각적인 소음을 나타냅니다. 일단 검출된 노이즈가 가지 유형 하나로 분류되면, ‘VoiceGate' 사용자가 지정한 주파수 영역내에서 노이즈에 대한 감쇠 처리를 시작합니다.







노이즈 컨트롤

‘VoiceGate’ 머신 러닝 알고리즘 기반으로 실행되고 있다는 점을 잊지 마십시오. 따라서 사용자는 ‘VoiceGate’ 노이즈에 대한 제어를 거의 자동으로 구현하기 때문에 파라미터를 설정하는 심혈을 기울일 필요가 없습니다. 그러나 노이즈를 제어하는 머신 러닝 메커니즘을 통해 나은 결과를 얻기 위해서는 ‘VoiceGate’ 기능과 컨트롤을 간략하게나마 알아둘 필요가 있습니다.



Mode 선택: Broadband Mode, Spectral Focus Mode



플러그인 상단에는 ‘Broadband Mode’ ’Spectral Focus Mode’ 가지 모드 선택 버튼이 있습니다. 기본 설정은 Broadband Mode 설정되어 있으며, 모드에서 'VoiceGate' 사용하면 'VoiceGate' 커버할 있는 전체 주파수 범위 (대략 50Hz ~ 10,000Hz)에서 노이즈를 제어 있습니다





상단의 윈도우는 필터가 반응하는 현재 주파수 응답을 보여준다.



인터페이스 중앙에는 개의 윈도우가 표시됩니다. 상단 윈도우에는 'VoiceGate' 커버할 있는 전체 주파수 범위에서 필터의 현재 주파수 응답이 표시됩니다. 사용자는 윈도우를 통해 필터에 의해 감쇠(attenuation)되는 노이즈의 주파수 영역과 감쇠 정도를 직접 모니터링 있습니다.





하단의 윈도우는 플러그인을 통과하는 전체 시그널의 양과 필터링된 노이즈의 양을 보여준다.



하단 윈도우에는 출력 파형과 함께 회색 입력 파형이 표시됩니다. 여기에서 플러그인을 통과하는 전체 신호의 양과 실시간으로 필터링되는 노이즈의 양을 관찰 있습니다. 회색 파형은 노이즈 필터링을 통해 절단 부분을 나타냅니다.





Steady Noise Impulsive Noise 파라메터



인터페이스 하단에는 개의 다른 노이즈 유형에 대한 개의 제어 섹션이 있으며, 섹션에는 개의 파라미터 컨트롤이 있습니다. 왼쪽 섹션은 시간에 따라 파형이 크게 변경되지 않는 Steady Noise 제어하기 위한 것이며, 오른쪽 섹션은 click이나 pop 노이즈와 같은 Impulsive Noise 처리합니다. 섹션 모두에서 최대 허용 감쇠값 sensitivity 값을 정의할 있습니다. ‘Max Reduction’ 선택된 노이즈의 최대 허용 게인 감소값(gain reduction) 설정할 사용됩니다. 게인 감소값은 섹션에서 설정된 최대 감소(Max Reduction) 아래로 떨어지지 않습니다. 만약 사용자가 steady noise 혹은 impulsive noise 필터링 하려면 선택하지 않은 다른 섹션의 Max Reduction 값을 0 dB 설정하여 섹션을 비활성화 하면 선택한 섹션의 노이즈만 필터링 있습니다. ‘Sensitivity’ 필터가 노이즈를 얼마나 공격적으로 처리할지를 설정합니다. 낮은 Sensitivity 에서는 노이즈 감소 효과가 거의 일어나지 않습니다. 또한, Sensitivity 감쇠된 노이즈와 프로세스 결과로 발생되는 부작용 효과(artifacts) 사이의 절충을 찾을 사용될 있습니다. 일반적으로 Impulsive Noise 섹션은 대부분의 노이즈를 처리합니다. 그러나 지속적이고 일정한 노이즈를 Impulsive Noise 섹션으로 처리할 경우, 때때로 빠른 gain 변화로 인한 변조 노이즈(modulated noise) 발생을 초래할 있습니다. 이러한 경우에는 Steady Noise 섹션을 사용해 노이즈를 처리하면 보다 바람직한 결과물을 얻을  있습니다.





Spectral Focus 모드



플러그인 상단에는 Bypass 버튼과 함께 Spectral Focus Mode 선택 버튼이 있습니다. Spectral Focus Mode 에서는 사용자가 지정한 특정 주파수 영역에 대해 파라미터를 개별적으로 설정할 있습니다. 상단의 윈도우 에서 개의 편집 가능한 영역 곳을 클릭하여 하나의 영역을 선택하고, 흰색 점을 왼쪽이나 오른쪽으로 드래그하여 선택한 영역의 범위를 설정 다음, 선택한 영역에 파라미터 값을 적용할 있습니다. 기본값은 주파수 영역 모두를 동시에 처리하도록 설정되어 있지만, 예를 들어 자음 소리(consonant sound) 포함된 고주파수 영역을 건드리지 않고 저주파수 노이즈만 감쇠 시키려면 사용자는 저주파수 영역을 선택해 노이즈를 처리할 있습니다. 또한 인터페이스 상단 윈도우에 있는 흰색 점을 드래그하여 다른 대역의 크로스 오버 주파수(cross-over frequency) 조정할 있습니다. 인터페이스 하단의 파라미터 섹션에는 노이즈 유형마다 6 개의 다른 노브(knob) 있습니다. 컨트롤은 Broadband Mode 동일한 방식으로 작동하지만 여기서는 밴드마다 개별적으로 작동합니다. 만약 대역에서 노이즈 감소를 원하지 않으면 대역의 Max Reduction 파라미터를 0 dB 설정하십시오.







VoiceGate 거친 소리

Broadband Mode에서 'VoiceGate' 음향적으로 처리되지 않은 방에서 녹음된 보컬 트랙에 존재하는 거의 모든 유형의 노이즈에 즉각적으로 반응했습니다. Steady Noise 필터는 창문을 통해 간헐적으로 들려오는 새들의 지저귀는 소리와 근원을 없는 Hum 노이즈를 자동으로 감지하고 제거했습니다. 한편 Impulsive Noise 필터는 저가 마이크로 녹음된 보컬에서 각종 치찰음과 거친 호흡 소리들을 실시간으로 제거했습니다. ‘VoiceGate’ 이러한 방식으로 노이즈를 제거하고 소리를 보다 깨끗하고 명확하게 합니다. 놀라운 점은 VoiceGate 거친 소리는 소리에 어떤 왜곡이나 과장이 없었으며 처리된 노이즈 영역 밖의 주파수 영역은 그대로 보존되었다는 점입니다


Spectral Focus Mode에서는 사용자가 지정한 좁은 주파수 영역에서 노이즈를 외과적으로 제거(surgical elimination) 있기 때문에, 모드에서 나는 보컬의 다른 노이즈는 건드리지 않고 오직 고주파영역의 치찰음(sibilance)만을 제거할 있었습니다. 또한 사용자는 선택한 영역의 노이즈 만을 모니터링 있는데, 이는 제거될 혹은 보존될 노이즈를 찾는데 상당히 효과적인 것으로 보입니다. 


‘VoiceGate’ 머신 러닝 알고리즘은 다양한 사용자 경험으로부터 얻은 새로운 데이터를 지속적으로 인공 신경망에 추가함으로써 꾸준히 개선될 것이며, 따라서 ‘VoiceGate’ 인간의 스피치와 보컬에서 발생하는 거의 모든 종류의 노이즈를 감지하고 처리할 있을 것으로 보입니다.








‘VoiceGate’ 주요 용도:

  • 스피치나 보컬 녹음의 노이즈를 실시간으로 줄여줌
  • 클릭(click) 이나 (pop) 노이즈를 제거함
  • 배경 잡음(background noises) 제거함
  • 다양한 종류의 노이즈를 실시간으로 감지하고 처리함
  • and more.





가격 정보:

 

€84.00 EUR (84 유로)


 


*macOS Windows 7일간 전체 기능 평가판 버전을 무료로 다운로드 받을 있습니다: 여기






Accentize 머신 러닝(machine learning) 분야의 최근 발전은 우리가 데이터를 다루고, 이해하고, 처리하는 방식을 변화시켰다. 새로운 이론적 통찰력, 자유롭게 사용할 있는 프로그래밍 라이브러리의 증가, 컴퓨팅 리소스에 대한 액세스 증가로 인해 데이터 처리 문제를 다른 각도에서 해결할 있는 새로운 가능성이 대두되었다. Accentize사는 최첨단 머신 러닝 이론을 오디오 신호 처리 영역에 적용하는 중점을 두고, 최첨단 연구와 그것의 생산 구현 사이의 격차를 해소해 왔다.






'VoiceGate' 대한 보다 자세한 정보