【导语】推荐系统,对于面对无限选择的互联网长尾来说,已经必不可少,既是网站推广的选择,也是用户的选择,具备的商业应用价值和用户应用价值都是互联网长尾的重要系统。有许多朋友已经在这个掘金。我们还需要借鉴和合作。free hit counters

互联网已逐渐成为数字多媒体资产(数字音乐,数字电影…)的存储和分发中心。虽然互联网的结构能使用户方便的获得内容,但这些内容资源需要有强有力的管理检索呈现工具的支持,数字音乐内容当然也不例外。基于用户音乐口味的个性化音乐内容推荐是当前最热门的应用方法。而同时音乐作为与朋友交流关于个性、历史、文化等重要的媒介,所以很多音乐服务中往往会融入SNS的应用。

用户特征描述

音乐内容本身有一定的文字信息(专辑的简介、音乐人的生平….等),但这些信息很难直接与音乐文件相关联。一般的音乐社区会要求用户建立自己的Profile作为分析用户音乐口味的最基本要素,这也更利于SNS的融合。像FOAF就是一种常用的方法。

“朋友的朋友”(Friend-of-a-Friend (FOAF)),FOAF 是一种 XML/RDF词汇表,它以计算机可读的形式描述用户放置在类似个人主页上的个人描述之类的信息。FOAF也是一种创建支持在线社区的信息系统的有用构件

音乐推荐系统的目标是基于用户的音乐口味向终端用户推送喜欢和可能喜欢但不了解的音乐。而音乐口味和音乐的参数设定是受着用户群特征和用户个性特征等不确定因素影响。例如年龄、性别、职业、音乐受教育程度等的分析是能帮助提升音乐推荐的准确度。部分因素它是可以通过使用类似FOAF的方法去获得。但要使这个描述对推荐系统有最大的价值,设计描述的字段也是有一定的难度。同时驱动用户更主动的去填写尽可能多的信息对互联网运营来说也是一个挑战。

音乐信息的呈现

音乐推荐系统的其中一个重要特征是使用户具有动态获得新音乐和相关信息的能力,也就是说用户能在使用的过程中不断能发掘新的音乐。部分非点播类音乐网站采用RSS的方法去推送,将这些新音乐信息推送给用户。RSS的内容聚合功能还能将音乐新闻、音乐事件(演唱会活动)、新专辑信息、专辑简介等音乐相关信息聚合。iTunes音乐商店提供了每周更新一次的RSS feed,向用户推荐新发布的新专辑。

这种结合RSS的方法能有效的挖掘用户对音乐的深层次需求,以提高对网站服务的粘性。用户在音乐的需求并非只是欣赏,音乐学习、音乐交流、参与音乐会….都会是相关的需求。

音乐个性化推荐系统

常规的音乐个性化推荐系统常用的实现方法有两种:分别是协作过滤内容过滤

一、协作过滤方法是通过用户的回馈分析实现音乐推荐系统的不断优化。这些回馈又可分为显性和隐性两类。显性的数据比如用户对音乐的评分、评论、收藏等,而隐性的则是用户的音乐行为习惯的收集。协作过滤的问题是需要面对海量数据的处理无效数据的过滤(包括Spam的剔除)等等。另有一个缺陷是很难实现一种创造性音乐类型的推荐,也就是说有一个新音乐如果与其他音乐有极低的相似性或者没啥相似性,那么系统就很难把这个新音乐向用户推送出去。

这种方法的优势是比较直观和降低专业门槛。作为网站来说,应该具有深刻理解内容的团队,但毕竟音乐是门综合的艺术,要组建一支熟悉各种音乐类型、音乐文化背景和历史的团队也绝非易事。它常用的具体手段是:

  • 通过播放器(iTunes,Winamp,Foobar等)插件跟踪和记录用户收听的音乐;
  • 搜索与用户音乐喜好近似的其他用户;
  • 推荐这些近似爱好的其他用户收听的音乐;

亚马逊的音乐推荐、Last.fm的Audioscrabble、MusicMobs等都是采用此类方法,有兴趣的朋友可以去琢磨一下开源的irate音乐推荐系统。

二、内容过滤方法是通过提取音乐内容本身的信息和结合音乐元数据的分析,然后根据与用户音乐口味的差值比较去呈现最接近的音乐。音乐元数据分析也就是给每首歌曲添加标签,这些标签可能包括音乐的调性、速度、节奏…..等等。

这种方法的弊端是需要大量专业的人工完成,分析的结果受这些专业人员一定程度上的主观因素影响,而且本身元数据的分类和分级设计是一项非常专业的工作。这可能也是采用这种方法的网站相对较少的原因。

这种方法最大的有利之处就是解决了协作过滤中新音乐推荐的问题。潘多拉音乐服务是最典型的内容过滤,据称是采用了200多种音乐元数据。

三、一定的内容过滤结合协作过滤被认为是既能解决以上二种方法的弊端,又能发挥它们的优势的办法。

其他

隐私保护:个性化信息获得的同时也触及了用户的个人隐私,那么如何保护用户的个人隐私也是系统需要解决的关键问题。

Mashup应用:调用其他相关类网站的API以丰富内容,例如国外很多网站采用Mashup去调用Upcoming.org的演唱会信息。

总结

个性化音乐推荐系统是“音乐2.0”最常用的工具,也是实现音乐长尾模式的方法。对于数字音乐服务来说,无论是音乐下载服务,还是互联网音乐电台服务,都需要有优秀的内容推荐系统去辅助。整个系统的大致流程是:从用户的个人描述估算用户的音乐兴趣—->收集用户的音乐收听习惯(内容的分析)——>数据比较分析(相似乐队和相似用户的计算)—–>推送近似用户兴趣的乐队和歌手的音乐及相关信息。


1 条评论

姐@一直很腐 · 2012-11-27 上午11:01

这个介绍得好笼统。有没有具体场景下的详细推荐算法的介绍?比如豆瓣电台推荐系统的构建思路,在哪个板块运用了哪些推荐算法;如何解决冷启动问题、数据稀疏性问题,以及其推荐系统效果的评估;目前还存在哪些问题,有米有解决思路?跪求

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注