최근에 벅스가 콧노래만으로 노래를 찾아주는 나요미디어를 인수하였다고 해서 뉴스가 되었다.

콧노래(허밍)을 기반으로 노래를 찾아 주는 검색 서비스는 나요미디어뿐 아니라 미국,일본에서도 유사 서비스를 가지고 구글을 추월(?)해서 세계 음성 검색 시장을 제패하려는 업체들이 도약을 준비하고 있다.

사용자 삽입 이미지

한국대표 나요미디어   http://www.nayio.com
엔터테인먼트 솔루션 개발업체 나요미디어(대표 주기현 http://www.nayio.com)는 11일 노래 제목이나 가수 이름을 몰라도 머릿 속에 떠오르는 음을 읊조리는 행위만으로도 해당 음악을 검색해주는 클라이언트·서버 방식의 음악검색 엔진 ‘뮤진’을 세계 최초로 선보였다  
                                                                                          2004년5월12일자 전자신문에서

나요미디어의 뮤진 시스템은 클라이언트. 서버 방식으로 구성돼 있으며 뮤진 클라이언트는 두 소절 정도의 허밍으로 입력된 멜로디로부터 음악의 고유한 특징을 추출해 음악적 유전자로 변환하는 기능과 검색 결과로 얻어진 음악을 재생하는 기능을 가진다. 또한 뮤진 서버는 클라이언트가 요청한 음악적 유전자를 이용해 나요미디어 고유의 음악 저장방식인 뮤진 데이터베이스에서 해당 노래를 검색하고 그 결과를 사용자에게 보내주는 기능을 가지고 있다. 뮤진시스템의 특징은 일반 사용자에게는 허밍이라는 손쉬운 방식으로 원하는 노래를 찾을 수 있도록 한다는 것과 음악 전문가, 특히 작곡가들에게는 자신이 작곡한 멜로디의 창작성 여부를 검증해 볼 수 있는 특화 서비스까지 제공한다는 점이다

사용자 삽입 이미지

일본대표 우타고에   http://www.utagoe.com/
メロディを口ずさむと、その曲のタイトルを教えてくれるシステムです。
国際特許(※)を取得した独自の認識技術を利用し、PCや携帯電話の他、カラオケや音声認識機能付き携帯ゲーム機等と連携したビジネスが期待できます。

멜로디를 흥얼거리면, 그곡의 타이틀을 가르쳐 주는 시스템입니다.
국제특허를 취득한 독자적인 인식기술을 이용하여, PC와 휴대폰 그외 가라오케와 음성인식기능 휴대용 게임기등과 연계한 비즈니스가 기대됩니다.

私の配属と入れ替わりに卒業する先輩の貝塚智典さんが、歌声の中に現れる母音を手掛かりに、楽曲を認識する研究をされてました。私はとても面白いと思いました。当時は、次世代検索エンジンとして、画像は注目されていましたが、2次元の画像処理はとても難しく手間がかかります。一方、音声は1次元波形です。そこで、私は、貝塚さんに教わりながら、音声認識の勉強を進め、自分がそれまでに勉強してきたテキスト検索のプログラムを組み合わせながら、歌声で曲を検索するシステムを開発することにしました。
내가 들어가고 동시에 졸업하는 선배중 가이즈카씨가, 노랫소리중에 나타나는 모음을 단서로 해서 곡을 인식하는 연구를 하고 계셨습니다. 저는 대단히 재미있다고 생각했습니다. 당시는 차세대 검색엔진으로서 이미지가 주목을 받고 있었습니다만, 2차원의 이미지 처리는 굉장히 어렵고 손이 많이 갔습니다. 음성의 경우는 1차원파형입니다. 그래서 저는 가이즈카씨로부터 배우면서 음성인식 공부를 진행하여, 제가 지금까지 연구해온 텍스트 검색의 프로그램을 조합하여, 노랫소리에서 곡을 검색하는 시스템을 개발하게 되었습니다.

研究室に洗面用具と風呂桶を持ち込んで、3週間ほど研究を進めた頃、現在のうたごえの検索エンジンに近いものが出来ました。このとき、emacs で左の Ctrl キーの押し過ぎたため、小指は腱鞘炎になってしまいました。
연구실에는 세면도구와 목욕통을 가져다 놓고, 3주간정도 연구를 진행한 결과, 현재의 우타고에 검색엔진에 가까운 것이 만들어 졌습니다. 그때 emacs에서 왼쪽의 Ctrl키의 너무 눌러서 새끼 손가락이 건초담에 걸리고 말았습니다.

その後、研究室の方々に様々なアドバイスを頂きながら、このシステムは改良を重ね、先生に御覧になって頂いたところ、学会発表の機会を頂ける事になりました。こうして、「歌声による曲検索システム」は、社会的な評価の場に出して頂けるようになりました。最初に発表した情報処理学会では、大学4年生では珍しかった「大会奨励賞」に御選出頂きました。
그후 연구실의 여러분들로부터 어드바이스를 받으며, 시스템의 개량을 거듭해, 교수님에게 보여 드렸을때, 학회 발표의 기회가 주어졌습니다. 그리하여 "노랫소리에 의한 곡 검색 시스템"은 사회적인 평가를 받는 자리에 나설수 있게 되었습니다. 최초로 발표한 정보처리학회에서는 대학 4년생으로서는 드물게 "대회 장려상"에 입상하였습니다.    
                                                                                Utagoe의 CEO인 소노다(園田)씨의 개인 홈페이지에서



사용자 삽입 이미지

미국대표 미도미   http://www.midomi.com/
米国時間1月26日にベータ版の運用を開始したMidomiでは、ユーザーが歌ったり、口ずさんだり、口笛を吹いて楽曲を検索できる。検索結果には、商用で提供されている楽曲のほか、他のユーザーが録音した楽曲も含まれている。ユーザーは、検索結果のうち自分の音声とマッチする部分のみを聞くこともできる
미국시간 1월26일 베타판을 운영하기 시작한 Midomi는 유저가 노래하거나, 흥얼거리거나, 휫바람을 불러 곡을 검색할수 있다. 검색결과에는 상업적으로 제공하는 악곡외에 다른 유저가 녹음한 곡도 포함되어 있다. 검색결과중 자신의 음성과 매치되는 부분만을 들을수도 있다.

Melodisの最高経営責任者(CEO)であるKeyvan Mohajer氏は、スタンフォード大学出身で、音楽および音声認識分野の博士号を取得した人物だ。Mohajer氏によると、Midomiのベースとなっている言語/音楽認識技術は、「Multimodal Adaptive Recognition System」(MARS)と呼ばれるもので、速度、テンポ、歌詞、一時停止などさまざまな要因からサンプルを認識するという点で他の技術とは異なるという。
Melodis의 최고 경영 책임자(CEO)인 Keyvan Mohajer씨는 스탠포드대학 출신으로 음악과 음성인식분야에서 박사를 취득한 사람이다.Mohajer씨에 따르면, Midomi의 베이스가 되고 있는 언어/음악인식기술은 "Multimodal Adaptive Recognition System(MARS)"라고 불리는 것으로 속도, 템포, 가사, 일시정지등 다양한 요인으로부터 샘플을 인식하는점이 다른 기술과 틀리다고 한다.
                                                                                                    CNET Japan 기사에서

관련글
세계 최초 허밍 기반 음악 검색 엔진 개발
실리콘밸리 600억 신화 주기현 사장 음악검색으로 한국진출

Posted by 오픈검색
,

 
moonstake