高中生真的懂電影票房嗎?
如果一個行業能被一個中學生就帶偏了節奏,那這個行業本身也就極不健康。
(資料圖片)
最近,浙江三名高中生在國際核心期刊發文的消息被媒體廣泛報道。雖然此前就曾經有多個類似的案例,但是這篇論文題目還是吸引了我們的興趣——《基于人機協同特征處理的電影票房預測算法》。
在分析這篇論文之前,這個新聞事件本身已經受到了不少網友的質疑。
首先,這三位高中生并不是獨自撰文,而是作為這篇論文的第3、4、5作者。這篇正文只有12頁的論文,字數和研究量也并不多,第一作者是浙江大學的一名博士,有順水推舟帶人情之嫌。
其次,論文本身影響力也確實有限。根據其他網友探究,這個期刊有一名主編和六名編委,全部來自中東地區。其中主編和三名編委來自科威特大學,QS排名1000+。剩下三名編委來自埃及、卡塔爾和沙特,所屬學校排名最高在200+。這篇來自四區的論文影響因子僅有0.4。
最后,我們也發揮一下我們的專業,分析一下這篇研究電影票房預測的論文,究竟有多少有價值的內容。
論文表達了什么?
首先我們來看論文的摘要和論文結論,內容通過有道翻譯進行譯制,略有修改。
摘要:提高票房預測的準確性,有利于刺激電影市場的創作、市場投資、基礎設施建設和公共資源的合理配置,促進社會福利和文化繁榮。由于現有的票房收入預測算法沒有考慮電影產業結構,預測精度不理想。
本文首先構建了兩階段人機協同特征處理框架。第一階段以票房數據為基礎,利用回歸決策樹算法對所有票房特征進行初步處理,自動刪除不重要的特征;第二階段將特征處理與建立的人工神經網絡(ANN)相結合。在這一階段,機器處理的特征被手動分類,多個不兼容的特征集被劃分。設計了不相容集網絡修剪算法,對神經網絡進行了修剪。我們用從四個平臺上抓取的7098部電影構建了數據集。數值實驗結果表明,兩階段算法的平均絕對誤差(Mean Absolute Error, MAE)明顯優于基線模型,可以有效地直接降低不兼容特征之間編碼引起的噪聲,提高人工神經網絡的預測精度,加快人工神經網絡的正向推理速度,減少計算資源的消耗。
結論:借鑒“人在回路”的人機協作設計思想,提出了“特征篩選-神經網絡構建-人工修剪”的預測算法。它結合了傳統機器學習和深度學習理論,首次應用于電影票房預測領域。該算法在基于數據的傳統機器學習特征處理的決策樹算法基礎上,引入人類先驗知識,對構建的深度學習神經網絡進行人工修剪,然后對修剪后的神經網絡進行訓練,得到預測參數模型。實驗結果表明,與業界常用的線性回歸、決策樹、支持向量機等傳統算法相比,本文算法在預測精度上有明顯提高。這證明了本文方法的有效性。即人在回路是通過結合人和機器的優點來實現的。
作為第一篇將人機協作的思想引入電影票房預測算法設計過程的文章,本文也揭示了基于人機協作的AI算法設計在各個領域有著廣闊的應用前景。后續工作將探索非結構化數據集下的人在環預測方法,并嘗試在電影票房收益管理中進行實踐。否則,我們將繼續探索在其他應用背景下預測和分類任務的特定問題結構,分析人類所發揮的獨特作用,并相應地設計更高精度的人機協作機器學習算法。
首先,這篇論文的研究方向是根據北美電影市場的測算,因為所有票房以及評分數據比較全面,機器也相對方便抓取。
簡單來說,這篇論文就是設計了一個機器算法,這個算法是用來預測電影票房的。這個算法獨特之處,就在于該算法是在機器學習中引用了“人在回路”,提高了預測的精準度。就是運用海量數據進行計算和判斷,人工進行干預。機器就在此循環中不斷學習,變得更聰明更準確。
另外,論文當中預測票房的公式,主要是七個參數。分別是1.影片導演指數;2.影片演員指數;3.影片出品/制片公司指數;4.影片發行公司指數;5.影片預告片熱度指數;6.影片話題熱度指數;7.影片檔期指數。
通過這一點看,影片的票房預測研究理論也算基本合理,沒有太過于業余。
根據情報君了解,所謂AI、機器學習、人機交互等大數據測算技術,無論是在國內還是國外,都早就已經運用在了電影市場票房預測這一行當中,本文并不是首創。不過也因為預測準確率較差,目前仍然沒有對外開放,人機合作仍然是預測票房的最主要方式。不過無論是好萊塢每年100億美元+的市場,還是中國四五百億人民幣的市場,在AI、ML(機器學習)等業務范圍內,實在是屬于很小很小的一塊蛋糕。而對于中國市場來說,機器的準確性就更低了。
為什么在中國預測票房更難?
相比已經成熟的北美電影市場,中國電影市場的預測才是最難的課題。
雖然在好萊塢預測票房準確率一直不算太高,但是至少95%以上的電影,提前一周進行預測的話,誤差范圍能夠控制在50%以內。這也是基于北美以及海外發達的市場機制,但是國內并不是這樣。
電影票房預測是電影行業較為關注的一個研究方向,尤其是能否盡早給出準確的票房預測。如果能盡早的對票房做出預測,影片的制作方和發行方可以根據票房預測的數據,對影片的制作和發行做出適當的調整,更合理的使用預算,以獲得更高的利潤。預測的越早,越有實用的價值,但是目前無論是中國的票房預測,都基本集中在定檔之后的宣發期。
可以說,目前中國票房預測的意義,也許重要的不是最終預測出來的那個簡單的數值,而是預測過程中,對影片多元影響因素的分析從而調整對應的宣發策略以達到收益最大化。
不過市場畸形,加上觀眾盲目,也很容易導致爆款頻出、炮灰扎堆的現象,不利于中等體量影片的穩定發揮,市場上,除了回報率2-3倍的超級爆款,就是賠的連宣發費用都收不回的撲街影片,缺少了中間影片的填充。而影片檔期選擇、宣發策略的一招失誤,就可能導致整個影片的票房成幾倍的誤差,這也導致了對國產片的票房預測充滿了極大的不確定性。
很多的票房預測人士表示,只要看過片,就已經能對這部片的內地表現做一個八九不離十的預估,但是現如今,主流觀眾的口碑愈發難以捉摸,業內、影評人有時候甚至無法想到一部平庸的電影在主流觀眾面前會那么受歡迎,抑或是本來一部良心制作的影片會因為體裁限制而無人問津。
大數據沒有原罪,有的只是用大數據造假和輕信假數據的人。作為票房預測者,只有不斷的學習,面對數據造假見招拆招,更進一步理解市場,不斷的修改預測,不怕打臉。不要因為票房預測失靈,就否定大數據對于電影業的價值。
至少在未來5年內,在中國進行票房預測還沒有機器能夠做到。
責任編輯:hnmd004
- 高中生真的懂電影票房嗎?2022-12-06
- 聚焦:金融持續發力支持實體經濟2022-12-06
- 北京新增備案7家社區養老服務驛站2022-12-06
- 這項課題研究獲最高院年度司改專項調研優秀2022-12-06
- 12月6日新聞聯播速覽15條2022-12-06
- 多地影院恢復營業,全國單日票房一度超40002022-12-06
- 當前速看:北京環球度假區:12月7日起進入2022-12-06
- 今日精選:北京:不斷改進方法細化流程,精2022-12-06
- 環球熱資訊!深圳部分學校通知:在校核酸改2022-12-06
- 廣東發布加快開展基礎設施公募REITs試點實2022-12-06
- 今日要聞!北京:延長住房公積金緩繳期限、2022-12-06
- 天天熱門:風范股份擬9.6億元收購晶櫻光電602022-12-06
- 兩部門:建設一批高品質綠色健康建筑和低碳2022-12-06
- 世界要聞:北京:進一步降低企業經營成本,2022-12-06
- 北京:對小微企業貸款實施延期還本付息政策2022-12-06
- 百事通!北京:支持開發貸款、信托貸款等存2022-12-06
- 全球快資訊丨北京:延長住房公積金緩繳期限2022-12-06
- 懷柔鎮積極推進環境整治提升2022-12-06
- 消息!關乎咱爸媽,養老有TA,機構隨心查2022-12-06
- 熱點聚焦:三部門:新增14個地區開展二手車2022-12-06
- 天天快資訊丨晶圓代工廠聯電11月營收環比下2022-12-06
- 播報:保利置業前11月合同銷售額450億元2022-12-06
- 熱推薦:港交所:北向資金八年累計成交額達2022-12-06
- 世界消息!風電領域需要有大動作!歐盟下決2022-12-06
- 【天天播資訊】法國海上風電加速,啟動2.5G2022-12-06
- 今日聚焦!長沙縣第一人民醫院暫停社會面核2022-12-06
- 焦點消息!一批在杭事業單位公開招聘!部分2022-12-06
- 河南新鄉擬調整商品房項目配建保障房方式并2022-12-06
- 中國海外發展:前11月累計合約物業銷售額約2022-12-06
- 每日播報!福田汽車:11月新能源汽車銷量2382022-12-06