본문 바로가기

기술과 이성

'헨젤과 그레텔'과 말러는 무슨 관계? 메타데이터에 관한 한 단상

말러는 헨젤과 그레텔이다?

뮤직서버에 '헨젤과 그레텔'이라고 잘못 나오는 하이팅크의 말러 음반.



적어도 내가 최근에 구입한 두 장짜리 말러 음반에 따르면 그렇다. 겉표지는 그림에서 보다시피 햇빛 찬란한 숲의 풍경 위에, 베르나르트 하이팅크가 시카고 심포니를 지휘해 녹음한 말러 2번이라고 돼 있다. 발매처는 시카고 심포니의 자체 레이블인 ‘CSO Resound*’.

그런데 이 음반을 디지털 화일로 리핑하기 위해 뮤직서버에 넣었더니 거두절미하고 ‘haensel and gretel’이라는 단어만 나온다. 나머지는 다 미상 (unknown). 도대체 이게 뭡니까? ...

메타데이타(metadata)를 아십니까?
정보 관리, 혹은 정보 경영 (information management)을 공부한 사람이라면 누구나 알 법한 단어지만 대다수 일반 사람들에게는 귀설 수도 있다. 데이타는 알겠는데 그 앞의 메타는 뭔고? 네이버 사전에 찾아보면 이렇게 돼 있다. 

meta- [|metə] 1. <위치・상태의 변화와 관련 있음을 나타냄>
2. <‘더 높은', ‘초월한'의 뜻을 나타냄>
그러니까 메타데이타는 데이타 위의 데이타라는 뜻이 되겠다. 이를 약간 바꾸면 ‘데이타에 관한 데이타’ (data about data)다. 다시 말해 다른 데이타를 설명하거나 묘사하는 데이타라는 뜻. 맥주병이나 라면 포장지에 붙은 레이블을 생각하면 더 쉽겠다.
잠깐, 아무 표딱지도 붙이지 않은 병을 떠올려보자. 그게 맥주인지, 소주인지, 샴페인인지 알 도리가 없다. 물론 코카콜라 병이나, 하이네켄처럼 아예 병의 디자인과 색깔을 독특하게 구별해 만든 경우는 다르지만 - 이 경우에는 그 디자인과 색깔도 일종의 메타데이타라고 볼 수 있다 - 대개는 알 수가 없다. 그래서 표딱지가 중요하고, 메타데이타가 중요하다.

코카콜라라는 이름이 없어도 사람들은 이게 코카콜라 병임을 안다. 그런 면에서는 이 병의 독특한 생김새 자체가 메타데이타 노릇을 한다고 볼 수 있다.

인터넷 시대, 그리고 그것이 늘 데리고 다니는 또다른 표현 ‘정보 시대’, ‘정보 범람’, ‘정보 폭주’, ‘정보 과잉’ 같은 시대를 사는 지금, 메타데이타는 더욱, 정말이지 더더욱 중요하다. 흔한 영어식 표현을 빌리자면 ‘정보 시대에는 메타데이타의 중요성을 아무리 강조해도 지나치지 않다.’ 정보가 차고 넘치면 내가 찾고자 하는 정보를 찾기가, 특히 제때, 꼭 필요할 때, 찾기가 어려워지고 - 종종 불가능에 가까워지고 - 그럴수록, 그 정보의 정체를 일러주는 정보의 정보, 곧 메타데이타가 중요할 수밖에 없다는 얘기다.

상상해 보자. 문서 화일을 찾는다. 그런데 문서 이름을 실제 내용과는 상관없는 내 이름과 날짜로만, gildong_20091225.doc, gildong_20091226.doc 식으로 달아놔서, 이를테면 관광업계의 IT 동향을 주제로, 힐튼 호텔에서 프리젠테이션할 때 쓴 자료를 찾을 도리가 없다. 물론 이 경우 그 행사의 날짜를 찾아서 그 어간의 문서를 뒤져볼 수도 있겠지만, 그런 단서조차 없이, 특정한 주제에 대해 쓴 글을 찾고자 할 때는 저장한 파일을 일일이 다 열어보고, 앞 한두 페이지를 훑어보는 수밖에 없다. 그런 문서가 한두 개라면 모르지만 그걸 백 개, 천 개로 늘리고, 더욱이 작성자의 숫자를 백 명, 천 명으로 늘려 대기업의 환경으로 확장해 보면, 실제 찾고자 하는 정보를 제때 효과적으로 찾을 수 있으리라는 가망이 전혀 없다. 구글이나 빙 같은 강력한 검색엔진의 힘을 빌린다고 해도, 한계가 있다. 메타데이타를 엉뚱하게 달았거나, (대개는) 아예 달지 않은 경우라면, 특히 찾고자 하는 문서가 기밀로 분류된 문서라면 더더욱 그렇다.

정보시대는 도둑처럼 우리에게 들이닥쳤다. 아니 정보 폭주의 시대로 고쳐 불러야 옳겠다. 그리고 우리가 입으로는 늘 정보시대를 염불처럼 외우고 듣고 보았으나, 실제로 그 정보시대에 걸맞은 행위와 생활 습관, 영업 행태가 어떠해야 하는지에 대해서는 거의 전적으로 무지했고 무시했다.

그 한 사례를, 나는 지난 20여년간 모았던 CD를 정리해 디지털 화일로 옮기면서 실로 뼈저리게 느끼고 확인한다. 물론 내가 쓰는 뮤직서버가 문제일 수도 있다. 그것이 온라인으로 확인해 보는 음악 CD 데이터베이스가 충분히 많은 정보를 담은 주요 데이터베이스가 아니어서 그럴 수도 있다. 하지만 더 큰 문제는 CD를 만든 음반사들의 안이하고, 때로는 안이함을 넘어 범죄적일 정도로 무지한 녹음 행태이다. 

메타데이타가 엘리아후 인발의 말러 8번 녹음으로 잘못 적힌 파보 예르비의 말러 2번.

아다시피 CD는 LP와 카세트테이프로 대표되는 아날로그 시대를 마감한, ‘음악의 디지털화’를 이끈 주역이다. 그리고 디지털 화일의 최우선 필수 요소중 하나는 그 화일을 구별하고 규정할 수 있는 메타데이타를 제대로 입력하는 일이어야 마땅하다. 그러나 실상은 전혀 그렇지 못하다. 그렇지 못함을 확인하고 또 확인한다.


특히 황당한 것은 한국에서 제작한 짜깁기 음반들이다. 듣기 편한 곡들만 모으거나, 전원을 주제로 한 것들만 모으거나, 박력 있고 힘찬 음악만 모으거나 한 그 ‘컴필레이션’ 음반들. 이들중 과반수가 ‘no information available’로 나온다. 메타데이타를 아예 넣지 않았다는 얘기다. 이건 좀...

어젯밤에 겪은 또 한가지 황당한 경험. 버진 레이블로 나온 파보 예르비 - 프랑크푸르트 라디오 심포니의 (또) 말러 2번 CD를 뮤직 서버에 넣었다. 이 음반은 2010년 말에 나온 최신반이다. 그런데 CD 1은 그야말로 생뚱맞게도 엘리아후 인발의 말러 8번이라고 표시되고, CD 2는 ‘no information available’이었다. 이러면 일단 리핑한 다음 컴퓨터로 가서 뮤직서버에 온라인으로 들어간 뒤 그 파일의 메타데이타를 일일이 바꿔줘야만 한다. 그러지 않으면 도저히 찾을 도리가 없다.

허술하기 짝이 없는 메타데이타의 현실을 몸소 겪으면서, 정보시대의 허점, 디지털 정보의 함정을 발견한다.  참고 삼아 하나 더. 사이먼 래틀 경이 그 옛날 버밍엄 시립 교향악단 (CBSO)와 녹음한 말러 전곡 사이클중 하나를 올리브 뮤직 서버에 넣었더니 이런 엉뚱한 그림에다 'undefined'라는 메시지가 떴다. 실로 황당하달 밖에... 제대로 메타데이타를 넣지 않은 EMI 책임일까, 아니면 제대로 넣었는데 그를 인식하지 못한 뮤직서버 책임일까? 어느 쪽이든, 이 데이터를 바로잡아야 하는 것은 결국 나. 씁쓸하다.
*노트: CSO Resound를 볼 때마다 늘 느끼는 거지만 LSO Live, TSO Live처럼 다른 교향악단의 자체 레이블이 공통적으로 붙이는 ‘라이브’보다 훨씬 진중하고 멋진 이름이다. 리자운드라고 읽으면 공명한다는 뜻이 되고, 리사운드라고 읽으면 실황 공연의 소리를 재생한다는 (re-sound) 뜻이 되니 그 또한 절묘하다.