老司机91精品网站在线观看-老司机67194免费观看-老司国产精品视频-老熟人老女人国产老太-中文字幕日本在线-中文字幕日本一区久久

始創于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
您的位置: 網站首頁 > 幫助中心>文章內容

淺談網頁搜索排序中的投票模型

發布時間:  2012/9/15 14:37:05
  前些天讀了一本《選舉的困境》,其中有一章,從美國的選舉制度說起,介紹美國選舉制度的不足,然后針對其不足,提出種種改善,然而每種改善都有其各自的問題,其中的變化很有趣。
 
  先說美國選舉制度,美國的總統選舉是一種“贏者通吃”的方式,每個州根據其人口多少,有幾十或幾百的“州票”,州里的人對總統候選人進行選舉,在某個州獲得票最多的那個候選人,獲得這個州所有的“州票”,然后統計所有候選人的“州票”多少,獲得最多“州票”的候選人獲勝。
 
  這樣制度的問題是顯然的,比如如果只有兩個州,A州5個人,而B州4個人,州票也分別是5和4,如果某候選人X在A州以3:2獲勝,另一個候選人Y在B州以4:0獲勝,這樣顯然候選人Y在全國范圍內獲得了6張票,而候選人X只有在A州的3張票,但是由于“贏者通吃”,X獲得了A周的全部5張“州票”,Y只獲得了B周的4張“州票”,在全國只有1/3民眾支持的X居然獲得了選舉的勝利。
 
  這樣的情況在2000年美國總統選舉中就出現過,小布什的州票領先于戈爾,然而在全國民眾中統計支持戈爾的人數卻是大于小布什的,當然戈爾輸給小布什還有另一個原因,這里按下不表。
 
  如果放在算法領域,可以看出這里的問題在于,為了統計結果R(最適合的總統人選),找到了一個特征A(每個民眾的投票),而決定結果R的,卻不是特征A,而是由特征A推導出來的特征B(州票),在特征A向特征B的推導過程中,信息丟失了(每個洲的支持百分比不一樣)。
 
  “贏者通吃”這種制度的具體歷史原因先不說,有興趣的朋友可以去看原著。解決這種問題的最直接方案就是從“贏者通吃”變成直選,也就是一人一票,直接統計票數,然而這樣也會遇到一系列問題。
 
  在談那一系列問題之前,先把要解決的問題抽象一下:
 
  有n個候選人,每個選民對這n個候選人投票,最終在n個候選人中選出最合適、最符合民意、也符合邏輯的那個人。
 
  方案1:一票制,每人一票,選出自己最喜歡的候選人,對結果進行統計,得票最多的那個人當選。
 
  這樣做的問題是會導致作者定義的一種“鷸蚌困局”,舉例說,如果有ABC三個候選人,其中BC政見比較類似,支持B的人也比較支持C,反之亦然,在全民中,喜歡BC的人占多數,A的政見和BC相反,支持A的人在全民中占少數。這樣導致的后果就是,BC獲得的票會比較分散,而A獲得的票比較集中從而獲得勝利,如果BC中有1人不參加選舉,票就會集中到B或者C一個人的手中,從而使多數選民的支持者當選。前面按下不表的戈爾失敗的另一個原因,就是有人認為有跟戈爾政見類似的耐德的參與,他分散了部分戈爾的選票。
 
  可以對此問題有所改善的方案叫做“二選制”。
 
  方案2:二選制,每人一票,如果無人獲得大于50%的支持,則將得票最高的兩個候選人拿出來,再進行一輪選舉,得票多的人獲勝。
 
  法國總統選舉就是這樣的二選制,但是這樣的方法只能改善“鷸蚌困局”,而不能徹底解決,2002年的法國總統大選就出現了類似的情況,當時支持左派政見的民眾較多,然而在二選制下,最終的前兩名卻是一個右派和一個極右派。出現這種情況的原因是當年有16個總統候選人,且多數是持左派政見者,這樣就導致左派的票極端分散。
 
  方案3:n選制,每人一票,如果無人獲得大于50%的支持,則去掉支持最少的候選人,再進行一輪投票,若依舊無人獲得大于50%的支持,再去掉得票最少的候選人,直到有人大于50%支持為止。
 
  2001年奧委會決定北京為2008年奧運會主辦城市的時候,就是用的這樣的制度,在第一輪投票里大阪被淘汰,北京在第二輪就獲得了半數以上的支持,從而當選。
 
  n選制的問題在于不實用,如果是奧委會這種只有幾百個人投票的情況還可以使用,如果類似前面法國總統選舉,有16個候選人,舉國上下最多可能進行15次投票,成本太高。
 
  方案4:即刻復選制,每個民眾對候選人進行排序,如果某個候選人獲得了50%以上的首選,則直接獲得勝利,否則淘汰票數最低的候選人,并且把票數最低候選人的得票中的第二候選人拿出來,分給對應的候選人,如果有人獲得50%以上,則當選,否則再淘汰一位最低的,并且把他票分給里面排序最高的且未被淘汰的候選人,如此往復。
 
  愛爾蘭總統選舉和倫敦市長選舉采用的是類似的方案,此方案也有問題,試想如此場景:選民共10人,中間派候選人是3人的首選,左派和右派的候選人分別是4人的首選,當然左派選民最討厭右派候選人,而右派選民也最討厭左派候選人,而左派右派的民眾對中間派候選人倒是都可以接受,不管是即可復選制還是n選制,中間派候選人都會在第一輪被淘汰。而中間派候選人則是全體民眾都可以接受的人,也最能調和各派之間矛盾,最和諧。
 
  這個方案的本質問題是,雖然每個選民可以對候選人排序,但是在第一輪的時候卻只考慮了第一選,沒有考慮選民的二、三選。
 
  方案5:上行復選制,跟方案4類似,只不過第一輪淘汰的不是支持最少,而是反對最多的候選人(獲得最多末選票的候選人)
 
  再看上面提到的情況,中間派候選人由于不是任何人的末選,所以第一輪淘汰的是左派或者右派,再第二輪選舉中,中間派的候選人就可以獲勝了。
 
  方案5也有方案5的問題,考慮這樣一種情況,只有兩個候選人AB參選,選民9人,其中6人喜歡A而討厭B,3人喜歡B而討厭A,無論按照之前的哪種方式,都會是A獲勝。但是現在又多了兩個候選人C和D,喜歡B的3人中,都是把A列在最后一個候選的,而喜歡A的6人的末選,卻是BCD各2票,這樣,在第一輪選舉中,A就由于獲得了最多的末選票被淘汰了,而通過精心的構造例子,完全可以使B最終當選。僅僅由于CD參選或者不參選,A和B之間的勝負關系就發生了大逆轉。
 
  實際使用此方案的例子不多,只有在公元前507年的雅典有類似的方案,不是讓民眾投支持票,而是投反對票,把反對最多的人投出局。
 
  方案6:多賽制,民眾對候選人排序,然后候選人之間兩兩pk,統計每一張選票上看候選人A在候選人B前面還是B在A前面,如此找到獲勝場次最多的候選人來贏得選舉。
 
  這樣的問題是可能導致循環勝負,如ABC三個候選人,有3個民眾,投票分別是ABC,BCA,CAB,可以看出AB之間A獲勝兩次,A>B;BC之間B獲勝兩次,B>C,AC之間C獲勝兩次,C>A,這樣就構成了一個A>B>C的循環。這個是不是有點像足球聯賽的記分制啊,如果積分相同,足球比賽中可以再看凈勝球、進球、勝負關系等,但是作者并沒有在這個方面進行展開,而是介紹了另一種方式:博達制。
 
  方案7:博達制,民眾對候選人排序,假如有n個候選人,第一位的候選人得n分,第二位得n-1分,以此類推,然后統計每個候選人的總分,獲得最多分的獲勝。
 
  有人對博達制的批評是:可能有選民會利用這種方式進行作弊(投“策略票”),最支持B的候選人本來心目中的排序是B>A>C,但是由于相對A,他們還是更喜歡B,因此,為了把B拉上來,就得把A拉下去,他們的投票就變成了B>C>A。博達對此批評的回應是:我的制度只適用于誠實的投票者。
 
  而這本書的作者卻認為博達制的“策略票”問題沒那么嚴重,如果無法準確預測民意和精確控制策略票的投法,有可能因為用力過猛,不但把A拉下來了,反而讓C獲得的支持票增加,這樣就使得最支持B的那些人的“策略票”反而使得他們最討厭的C當選了,當年在IMDB上就發生過類似一幕:
 
  電影《蝙蝠俠6》上映后,蝙蝠俠的粉絲們覺得這部片太酷了,于是就想把蝙蝠俠6投成IMDB第一位,于是他們瘋狂的給蝙蝠俠6打高分,而同時,也紛紛的給當時的IMDB第一《教父》投低分,導致的結果就是用力過猛,教父變成了第三名,原來的第二肖申克的救贖(TSR)變成了第二(原來的第二是排在教父后面,新的第二是排在蝙蝠俠6后面),而后來,隨著瘋狂粉絲的熱情消退,理性的意見占據了上風,蝙蝠俠6的得分逐漸下降,跌到了第10。而教父還是在肖申克的救贖后面,很久沒有回去了。
 
  博達制是否有其他問題呢?
 
  以上只是對這本書第14章的一個筆記,也僅僅針對“多候選人單職位”問題進行了討論,書的后面還會對“多候選人多職位”的情況繼續探討,也就是根據每個人對候選人的排序,來決定最終的候選人排序。
 
  回到搜索引擎領域來,如上策略的變遷會給我們一些啟示,先看看之前抽象出來的問題:
 
  有n個候選人,每個選民對這n個候選人投票,最終在n個候選人中選出最合適、最符合民意、也符合邏輯的那個人。
 
  這很像搜索引擎在解決的問題:
 
  系統里有n個網頁,有m個特征(頁面質量、頁面內容豐富度、頁面超鏈、文本相關性等)對n個網頁有不同的打分,如何根據這些特征的“投票”,選出最適合放在第一位的網頁呢?
 
  從選舉的例子中,我們可以得到的幾個啟示:
 
  1. 設計算法時,要避免出現“贏者通吃”帶來的信息丟失問題。
 
  2. 不要因為某幾個特征特別好,就把某個網頁排到最前,或者因為某幾個特征特別差,就把某個網頁拋棄。
 
  3. 最合適放在首位的網頁不一定是在每個特征上都最好,而應該是能夠兼顧所有特征,綜合表現最好的那個。
 
  4. 搜索引擎使用者對搜索結果的點擊行為,可以看成是對搜索結果進行的“投票”,這樣的“投票”信息的使用方式,也要注意考慮是否會帶來選舉過程中出現的種種不合理。
 
  以上提到的種種選舉方案,僅僅是對“多候選人單職位的”的情況進行討論,而搜索引擎面對的問題,則更類似于“多候選人排序”的情況,也即:
 
  系統里有n個網頁,有m個特征(頁面質量、頁面內容豐富度、頁面超鏈、文本相關性等)對n個網頁有不同的打分,如何根據這些特征的“投票”,決定n個網頁的順序?
 
  而這個“多候選人排序”問題,是有一個“不可能的民主”的理論的,該理論的大意是,“合理”的民主應該滿足3個條件:
 
  1. 如果選民都認為A比B好,那么最終結果應該也是A比B好
 
  2. 沒有“獨裁者”,也即,不存在這樣一個人,無論別人怎么排序,最終結果的排序都和這個人的排序一致
 
  3. 無關因素獨立性,也即,在第一次投票完成后,A排在B前面,現在進行第二次投票,如果所有人都沒有改變自己投票中A和B的相對順序,那最終結果應該也是A在B前面
 
  而通過數學的證明,可以得出結論:如果某種選舉方式滿足條件1和3,則必然不滿足2,也即必然存在“獨裁者”,這個問題的證明,可以參考這篇博客:http://roba.rushcj.com/?p=509
 
  根據“不可能的民主”理論,和搜索引擎結合起來看,似乎搜索引擎很難給出一個合理的網頁排序,但是搜索引擎和投票又似乎有所不同,有兩個角度可以破解
 
  1. 認為條件3過于強,需要弱化。
 
  2. 也許在網頁排序問題上,真的存在這樣一個“獨裁特征”,這個“獨裁特征”從目前看來,最適合的應該就是“用戶滿意度”了,按照用戶的滿意程度來排序網頁,就是最合理的網頁排序。如何衡量“用戶滿意度”呢?這就是我們一直在努力的。

本文出自:億恩科技【www.ypdoo.com.cn】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線

     
     
    91麻豆高清国产在线播放| 国产亚洲精品aaa大片| 日日日夜夜操| 999精品在线| 国产91精品一区二区| 中文字幕97| 国产91素人搭讪系列天堂| 欧美激情一区二区三区视频| 韩国三级香港三级日本三级la| 欧美一级视频高清片| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 国产伦久视频免费观看视频| 日日日夜夜操| 黄视频网站在线看| 天天色成人| 欧美日本免费| 久草免费在线色站| 久久国产影院| 亚洲 国产精品 日韩| 99久久网站| 免费国产一级特黄aa大片在线| 欧美激情一区二区三区在线播放 | 国产一级强片在线观看| 国产一区二区精品在线观看| 中文字幕一区二区三区 精品 | 在线观看成人网| 国产一区二区精品久久91| 日韩在线观看免费| 999久久66久6只有精品| 成人a大片高清在线观看| 精品国产一区二区三区精东影业 | 你懂的国产精品| 精品国产三级a| 精品在线观看一区| 国产视频久久久| 精品在线观看一区| 欧美爱色| 亚洲第一页色| 日韩一级黄色片| 亚洲 国产精品 日韩| 精品久久久久久中文字幕一区 | 国产一区国产二区国产三区| 麻豆网站在线免费观看| 99色视频| 精品国产一区二区三区免费| 免费国产一级特黄aa大片在线| 成人免费观看的视频黄页| 青青久久精品| 国产网站在线| 毛片成人永久免费视频| 成人高清视频免费观看| 国产精品123| 国产伦精品一区二区三区无广告 | 日韩一级黄色| 久久精品免视看国产成人2021| 欧美国产日韩一区二区三区| 国产成a人片在线观看视频| 九九久久国产精品| 欧美国产日韩一区二区三区| 你懂的国产精品| 国产伦理精品| 午夜欧美福利| 青青青草影院 | 中文字幕Aⅴ资源网| 免费毛片播放| 免费毛片播放| 亚洲第一色在线| 青草国产在线| 欧美激情在线精品video| 精品国产一区二区三区免费| 久久精品道一区二区三区| 精品国产一区二区三区精东影业 | 国产成人女人在线视频观看 | 日韩免费在线视频| 国产91视频网| 亚欧成人乱码一区二区| 国产视频一区二区在线播放| 国产美女在线观看| 可以免费看污视频的网站| 黄色免费三级| 欧美激情一区二区三区在线 | 国产精品123| 亚洲www美色| 国产a毛片| 天天做日日爱| 毛片电影网| 亚洲精品永久一区| 国产麻豆精品hdvideoss| 国产一区二区精品| 日本特黄特色aaa大片免费| 国产亚洲精品aaa大片| 麻豆污视频| 欧美激情一区二区三区视频| 亚洲女人国产香蕉久久精品| 日韩在线观看免费| 国产不卡在线看| 毛片电影网| 亚久久伊人精品青青草原2020| 欧美1卡一卡二卡三新区| 91麻豆国产| 高清一级片| 亚洲第一色在线| 九九免费高清在线观看视频| 午夜精品国产自在现线拍| 免费的黄视频| 可以免费看毛片的网站| 日韩男人天堂| 青青久久网| 精品在线观看一区| 精品久久久久久影院免费| 国产a视频精品免费观看| 亚洲精品久久玖玖玖玖| 久久久久久久久综合影视网| 午夜欧美福利| 欧美电影免费看大全| 在线观看成人网| 精品国产三级a∨在线观看| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 午夜在线观看视频免费 成人| 欧美激情一区二区三区视频 | 久草免费在线视频| 黄色福利片| 国产不卡在线观看视频| 国产一区二区精品| 午夜欧美福利| 成人av在线播放| 亚洲精品中文字幕久久久久久| 精品国产一区二区三区久久久蜜臀| 香蕉视频久久| 韩国妈妈的朋友在线播放| 国产伦精品一区二区三区在线观看| 美女免费精品视频在线观看| 欧美18性精品| 国产91精品一区二区| 国产不卡高清| 午夜激情视频在线观看| 欧美另类videosbestsex视频| 沈樵在线观看福利| 中文字幕一区二区三区精彩视频| 国产极品白嫩美女在线观看看| 日本免费乱人伦在线观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 欧美激情一区二区三区中文字幕| 国产一区二区精品尤物| 欧美18性精品| 国产高清视频免费| 九九久久国产精品大片| 精品国产一区二区三区久| 免费国产在线视频| 欧美a免费| 日韩欧美一及在线播放| 黄色免费网站在线| 国产成人欧美一区二区三区的| 国产网站免费观看| 精品美女| 台湾毛片| 欧美激情一区二区三区视频| 国产不卡在线观看视频| 亚洲 欧美 91| 九九免费精品视频| 国产成人啪精品| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 美女免费毛片| 欧美另类videosbestsex久久| 日韩在线观看视频免费| 欧美激情中文字幕一区二区| 黄色短视频网站| 沈樵在线观看福利| 久久久久久久久综合影视网| 亚洲 国产精品 日韩| 欧美另类videosbestsex高清| 欧美另类videosbestsex高清| 91麻豆tv| 亚洲第一色在线| 九九久久国产精品大片| 你懂的国产精品| 中文字幕一区二区三区精彩视频 | 欧美另类videosbestsex视频| 一 级 黄 中国色 片| 97视频免费在线| 99久久视频| 国产精品123| 日韩中文字幕在线观看视频| 国产原创中文字幕| 国产精品123| 久久国产精品只做精品| 91麻豆高清国产在线播放| 日韩专区一区| 精品久久久久久中文字幕一区| 亚州视频一区二区| 欧美一级视频高清片| 国产精品免费久久| 欧美国产日韩久久久| 国产一区二区精品久久91| 国产成人女人在线视频观看 | 国产成人啪精品| 成人a大片高清在线观看| 欧美激情一区二区三区中文字幕| 精品视频免费在线|