'음악검색' 스마트폰 애플리케이션

페이지 정보

profile_image
작성자 강교성
댓글 0건 조회 6,707회 작성일 11-07-16 16:32

본문

[Weekly BIZ] 노래 제목 깜빡한 분을 위해…곡의 특징 DB화, 10초면 찾아내



조선
<Weekly BIZ>
이윤식 네이버 검색본부장 ▶기자의 다른 기사보기


입력 : 2011.07.15 14:22





[Tech] 음악 검색은 어떻게


네이버는 작년 10월 자체 기술로 만든 '음악검색' 스마트폰 애플리케이션을 국내 최초로 출시했다. 서비스를 출시했을 때는 '과연 사람들이 잘 사용할까' 걱정도 했지만 기우였다. 음악검색 이용자는 꾸준히 늘고 있으며, 반응도 좋다. 카페·상점뿐 아니라 TV 광고 등을 통해 음악이 일상 곳곳에 퍼졌기 때문이다. 특히 젊은 층을 중심으로 인디음악이 인기를 끌면서 유명가수가 부르지는 않았지만 귀에 익은 노래들을 검색하려는 사람들이 늘었다.

사실 음악검색은 사전에 기획해서 만든 기술은 아니다. 2008년쯤 개발자 몇 명이 실험용으로 음악인식 기술을 테스트한 적이 있었다. 그러던 중 사내에 '음악검색 만들었다던데'하는 소문이 나기 시작했고, '이 노래도 인식하나?'라며 개발자들끼리 묻고 답하면서 점차 정교화됐다. 하지만 당시만 해도 스마트폰이 거의 보급되지 않았기 때문에 이 기술로 서비스를 만들 수 있으리라고 생각한 사람은 없었다. 잊혀졌던 음악검색 기술은 2010년 모바일 서비스를 기획하면서 빛을 보게 됐는데, 이처럼 서비스와 기술은 우연한 계기로 결합하는 경우가 많다.

음악검색 서비스를 출시한 후 '이런 경우 인식이 되나요?'라는 문의를 받는 때가 많다. 좋아하는 노래를 콧노래로 부를 경우에도 인식을 하나? 라이브공연장에서 어떤 가수가 자신의 노래를 부를 때는? 녹음된 MR(Music Recorded·반주음악)을 이용해서 라이브 공연을 할 때는? 이런 질문에 답하려면 음악검색의 원리를 살펴봐야 한다. 노래가 흘러나올 때 음악검색 애플리케이션을 실행하면 스마트폰은 몇 초간 노래를 녹음한다. 애플리케이션은 스마트폰에 녹음된 노래에서 특징적인 소리 정보를 추출하고, 그 정보(음악 자체가 아니라)를 네이버 서버로 보낸다. 네이버 서버는 이 소리 정보와 맞아떨어지는 정보를 찾은 뒤에 스마트폰에 '이 노래군요'라며 검색 결과를 알려준다.


이 과정이 부드럽게 진행되려면 아날로그인 음악을 디지털로 바꿔 특징적 정보를 추출하는 게 중요하다. 즉, 음악을 주파수 대역(소리의 높낮이)별로 나누고 잡음이 끼어도 구분이 가능한 특징만을 골라 디지털 형태로 바꿔야 한다. 이처럼 음악검색은 흘러나오는 노래와 '동일한 음악 파일'을 찾는 것이기 때문에 콧노래를 부르거나 라이브로 부르는 노래는 인식하지 못한다. 하지만 MR을 틀어놓고 부른 경우에는 상황마다 다르다. 만약 MR 소리가 크다면 검색결과가 나올 수도 있고, MR 소리가 작으면 안 나올 수도 있다.

음악정보를 추출해 데이터베이스화하는 작업은 음악검색을 위한 가장 기초적인 단계에 불과하다. 이용자들이 만족할 수 있는 서비스를 만들기 위해서는 더 많은 고민이 필요하다. 우선 얼마 만에 검색 결과를 내놔야 하는지 생각해 보자. 소리를 듣자마자 바로 나오면 좋겠지만 아직 그런 기술은 없다. 최소한 몇 소절의 정보는 필요하다. 물론 1초간 녹음된 정보보다 1분간 녹음된 소리에서 나온 게 정확할 것이다. 그렇다고 1분간 녹음을 하고 있을 이용자는 별로 없을 것이다.

'검색 요청된 소리 녹음→녹음된 소리 데이터 처리→서버 전송→서버 검색→검색 결과 송출'에 걸리는 시간은 최대 10초 정도다. 그리고 이 과정에서 다른 부분의 기술을 고도화해서 소리 녹음에 좀 더 많은 시간이 돌아가도록 했다.

하지만 이런 조치가 비효율적이 될 수도 있다. 0.2초만 녹음된 정보를 분석해도 정답이 나오는 곡이 있는데, 그 이상 녹음을 하는 것은 시간 낭비가 된다. 그래서 적용한 게 '스트리밍' 기술이다. 즉 노래의 정보를 실시간으로 처리해 서버에 전달하고 정답이 나오면 더 이상 녹음을 할 필요가 없게 만든 것이다. 이를 통해 검색에 걸리는 시간을 3~4초 대로 줄여나갔다.

사람들은 언제 음악검색을 사용할까? 우선 낮보다 밤 시간 이용자가 많았고, 인식률은 낮이 더 정확했다. 사람들은 밤에 어디서 무슨 이유로 음악검색을 할까? 친구들과 어울리는 어떤 자리일 가능성이 크다. 여러 사람이 웅성거리는 카페일 수도 있고, 왁자지껄한 술집일 수도 있다. 녹음 과정에서 잡음이 끼어들 가능성이 더 큰 것이다. ***

 

Copyright © ChosunBiz.com
  • 카카오톡으로 보내기
  • 페이스북으로 공유
  • 트위터로  공유
  • 구글플러스로 공유

댓글목록

등록된 댓글이 없습니다.