北京pk10专家计划全天|pk10真的能赚钱吗
當前位置:100EC>生活服務電商>【產品研究】豆瓣圖書:推薦策略調研與問題歸納
【產品研究】豆瓣圖書:推薦策略調研與問題歸納
發布時間:2019年10月16日 10:32:18

(網經社訊)筆者列出相關指標,對豆瓣圖書的推薦策略進行了調研,歸納總結了幾個問題,針對問題給出了相應的改進方案。你的豆瓣給你推薦了什么書?

一、定義理想態

1.1 理想態定義

豆瓣推薦的書籍與用戶興趣相關(書籍查看率大于等于80%),令用戶滿意(書籍想讀率大于等于80%)并且能夠拓寬用戶興趣邊界(多樣性、時效性、新穎性)。

1.2 理想態指標

用戶滿意度,涉及指標定義如下:

  • 書籍查看率:用戶點擊推薦書籍數/推薦書籍數;

  • 書籍想讀率:用戶標記推薦書籍想讀數/推薦書籍數;

  • 書籍評價率:用戶評價(包括標記讀過、在讀、評分)推薦書籍數/推薦書籍數。

預測準確度,涉及指標定義如下:

  • 預測準確度:點擊查看書籍數/推薦書籍數;

  • 覆蓋率;

  • 多樣性;

  • 時效性;

  • 新穎性。

二、抽樣分析

2.1 Case選擇

5~10本書籍的case選擇覆蓋面太窄,因此目前將書籍從內容類型角度分為9種類型,每種類型選擇一本書,具體選擇如下圖所示。

2.2 Case匯總

9種case匯總如下圖所示(由于表格較長,一張表格拆成兩張圖展示)。

2.3 問題分析

案例1

【推薦書籍5、6、7、9、10】

問題說明:多樣性不足-同一個作者推薦太多。

從文學小說這個類型的書籍出發,雖然大家對同一個作者的書籍更有可能感興趣,但是查看書籍為同一作者的推薦項占比超過50%還是過高了。因此這5本書籍的主要問題都是同一個作者推薦太多。

原因:不管從作者角度,還是內容類型角度出發,該書籍都不可能屬于冷門書籍。因此推薦多樣性不足的原因就不可能是收錄的書籍數目太少,而應當是權重有問題,導致同一個作者的書籍占據了推薦書籍的90%。

可能的原因有三種:

  1. 有可能是作者標簽過重;

  2. 用戶協同過濾算法權重過大;

  3. 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦90%為同一作者書籍。

改進方案:

  1. 推薦邏輯中,降低作者標簽權重;

  2. 推薦邏輯中,降低用戶協同過濾算法權重;

  3. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例3

【推薦書籍2、3】

問題說明:推薦準確度太低-幾乎無相關性。

這兩本書相關性過于弱了,對于查看5+3的用戶來說,很有可能是學生家長,也很難會對這兩本書感到滿意。

原因:從該case其他推薦書籍來看,豆瓣雖然可能對教輔書的收錄和標簽管理不足,但也有其他通識教育類的書籍可以推薦,因此出現該問題的原因應當是標簽不準確。

改進方案:

  1. 增加收錄該類目書籍;

  2. 調整優化書籍標簽。

【推薦書籍4、5、8、10】

問題說明:推薦準確度太低-屬于同一大類型,但細分類差別太大。

這4本書從內容角度來看具有一定相關性,可以屬于一個內容類型大類。但是,從細分領域來看,兩類書的差別還是較為明顯,可能能夠探索用戶的興趣邊界,但是用40%的推薦項來探索用戶興趣邊界過多了。

原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。

改進方案:

  1. 增加收錄該類目書籍;

  2. 調整優化書籍標簽。

【推薦書籍6、7】

問題說明:推薦準確度太低-幾乎無相關性。

相關性過弱,而作為探索用戶的興趣邊界的推薦項,與上一個問題加起來占比超過60%,顯然不是正確的策略。

原因:同類型書籍收錄過少,標簽不準確,推薦目的錯誤。

改進方案:

  1. 增加收錄該類目書籍;

  2. 調整優化書籍標簽。

案例4

【整體問題】

問題:推薦準確度太低-沒有推薦該作者的其他書籍。

沒有推薦該作者的其他書籍。單個推薦書籍沒有問題,但是整體來看該作者推薦書籍太少。《全球通史》作為熱門書籍,作者也并不是只有這一本代表作的情況,存在一定明星效應,因此可以多推薦1、2本該作者的其他書籍。

原因:標簽權重有問題。

改進方案:推薦邏輯中,提高作者標簽權重。

案例6

【推薦書籍1】

問題說明:時效性考慮不足。

時效性不足,書籍作者有更新的攝影書籍《長皺了的小孩》,該書豆瓣已有收錄,但是豆瓣并沒有推薦。

原因:標簽權重有問題。

改進方案:推薦邏輯中,提高時效性標簽權重。

【推薦書籍4、10】

問題說明:多樣性不足-同一個作者推薦太多。

算上書籍2、3,推薦阮義忠的書籍共有4本。阮義忠不是該書籍的作者,但他的書籍占推薦項的40%,顯然過多了。

原因:

  • 標簽權重有問題;

  • 用戶畫像中用戶對該作者的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。

改進方案:

  1. 優化推薦規則,減少同一作者的推薦書籍;

  2. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(作者)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例7

【推薦書籍10】

問題說明:展現順序不合理。

該書籍與查看的書籍相關性很高,但是卻排在推薦書籍末尾,排序有問題。

原因:標簽權重有問題。

改進方案:排序邏輯中,提高內容相關性標簽權重。

案例8

【整體問題】

問題說明:多樣性不足-同一套書籍推薦太多。

所有推薦書籍均為火影忍者,沒有多樣性可言,很難讓用戶滿意。

原因:

  • 標簽權重有問題;

  • 用戶畫像中用戶對該套書籍的喜好程度極高,且權重大,導致推薦40%為同一作者書籍。

改進方案:

  1. 推薦邏輯中,降低成套書籍相關性標簽權重;

  2. 推薦邏輯中,當用戶畫像中,用戶對某一標簽(成套書籍)的喜好程度極高,導致推薦過于單一(造成40%以上的推薦都是同一標簽)時,推薦中需要相應降低用戶畫像的權重。

案例9

【推薦書籍2】

問題說明:展現順序不合理。

該書籍與查看的書籍相關性并沒有其他推薦書籍高,但是排在推薦書籍第二位,排序有問題。

原因:標簽權重有問題。

改進方案:排序邏輯中,提高內容相關性標簽權重。

【推薦書籍8】

問題說明:重復推薦。

該書籍與推薦書籍7重復,這本應該是一個非常容易避免的錯誤。

原因:排序規則有問題。

改進方案:優化推薦規則,過濾重復書籍。

三、改進方案

3.1 改進方案匯總

影響面計算說明:問題涉及案例推薦書籍數/總案例推薦書籍數=x/90。(來源:人人都是產品經理 文/misbone 編選:網經社)

網經社致力于打造“中國領先的電商產業鏈綜合服務商”,基于旗下電子商務研究中心、電融寶、電數寶、商學院、電訴寶五大平臺,我們推出三大服務體系:(1)平臺服務:包括會員、數據、融資、售后顧問、法律等;(2)智庫服務:戰略顧問、政府智庫、報告贊助及定制、圖書贊助、專家培訓等。(3)媒體服務:包括商業報道、自媒體和社群、電商快評、品牌顧問、IPO服務等 。為各大電商上市公司、獨角獸、創業者以及國家和各地政府部門等提供專業服務。

【版權聲明】秉承互聯網開放、包容的精神,網經社歡迎各方(自)媒體、機構轉載、引用我們原創內容,但要嚴格注明來源網經社;同時,我們倡導尊重與保護知識產權,如發現本站文章存在版權問題,煩請將版權疑問、授權證明、版權證明、聯系方式等,發郵件至[email protected],我們將第一時間核實、處理。

    北京pk10专家计划全天 快乐飞艇 足球指数网免费 北京11选5 皇冠篮球比分网 大蠃家足球即时比分163 河南快赢481 十一运夺金 广西快乐十分 即时比分网 内蒙古时时彩 五分彩 线上nba比分预测 中国足彩网即时指数 河北20选5 实况nba比分在线 最新版本雷速体育下载视频