文章摘要
文章探讨了Rotten Tomatoes是否仍然可靠,指出近期几乎所有电影都被评为“Certified Fresh”,引发质疑。作者提出两种可能性:一是人类已不再制作糟糕的电影,二是Rotten Tomatoes可能受到商业利益的影响,导致评分标准发生变化。通过数据分析,作者暗示该平台可能已不再完全客观。
文章总结
烂番茄评分还可靠吗?——一项统计分析
最近,我在酒店观看了有线电视,不可避免地接触到了无法跳过的广告,其中许多广告宣传即将上映的电影。我注意到一个明显的模式:每部电影都在烂番茄上获得了“新鲜认证”,这一标志成为了广告的最终卖点。经过五天的“新鲜认证”电影宣传,我开始怀疑:如果每部电影都不“烂”,那么只有两种可能:
人类已经不再制作糟糕的艺术品:经过一个世纪的试错,人类已经完美掌握了电影艺术,最近的杰作如《猫》、《空中大灌篮:新传奇》、真人版《白雪公主》、《红色一号》和《小丑:双重疯狂》都证明了这一点。曾经以批评人类创造力为乐的影评人,如今也沉浸在这一电影黄金时代,对迪士尼和华纳兄弟的永恒艺术赞不绝口。
烂番茄发生了变化:也许这个看似客观的平台已经被企业利益所影响。如果这听起来像阴谋论,那是因为它确实是(尽管是一个低风险的阴谋)。
通过深入分析数据,这一“阴谋”似乎更像是“事实”。因此,本文将探讨烂番茄评分的可疑调整,追溯好莱坞这一最重要的艺术卓越标志何时以及如何变得“烂”了。
烂番茄成立于1998年,最初是为了汇总成龙电影的影评。几个月后,其创始人意识到这一概念的广泛潜力,将平台扩展至所有电影。该网站迅速成为影评共识的可靠代表,并在过去25年中一直保持这一角色。
烂番茄通过其标志性的“番茄计”评分来评估电影,该评分基于影评中“正面”评价的百分比。无论是3/5星的温和评价,还是对电影才华的热情赞美,都被视为“正面”。番茄计评分超过60%的电影被标记为“新鲜”,低于此阈值的则被标记为“烂”。
尽管许多人批评烂番茄的简单汇总方法,但该网站的吸引力很大程度上在于其直接的方法论。根据Morning Consult的民意调查,近三分之一的美国人在观看电影前会查看番茄计评分,使烂番茄成为好莱坞最具影响力的品味塑造者。该网站表面上透明,这有助于其感知的完整性和广泛的消费者信任,同时也使其底层机制易于审查。
在一个校准良好的系统中,影评评分应随时间保持稳定,除非电影质量发生显著变化。那么,为什么过去十年中番茄计的平均评分有所上升?是电影变了,还是评分标准变了?
这一评分变化与2016年Fandango收购烂番茄的时间点吻合。考虑到Fandango是美国最大的电影票务平台,部分由NBC环球和华纳兄弟探索公司拥有,这可能存在利益冲突。
为了验证这一点,我决定研究烂番茄的影评评分与用户生成的观众评分之间的关系。虽然影评人和观众并不总是意见一致,但他们的情绪往往高度相关——影评人的负面评价通常预示着观众的类似反应,反之亦然。2016年之前,较高的观众评分通常与较高的番茄计评分同步。
然而,2016年后,影评评分与观众评分出现了明显的分歧,而番茄计的平均评分也开始上升。
那么,如何在烂番茄的严格参数内改变番茄计评分?最终,烂番茄对其番茄计评分的两个主要输入有控制权:
- 影评是否被视为“新鲜”或“烂”。
- 哪些影评计入番茄计。
调整“新鲜”的定义会立即引发影评人的强烈反对,他们可能会利用自己的平台公开抨击烂番茄。一个更微妙的手段是影评人的选择:扩大影评人群体,纳入更多(巧合地)给出更积极评价的作家。
事实上,在Fandango收购后,主流电影的影评人平均数量增加了40至70人。这可能是为了适应新兴的数字媒体平台,如The Ringer和BuzzFeed,从而使烂番茄能够随着不断变化的媒体生态系统发展。然而,当我们审查过去十年中新增的最多产出版物时,发现其中许多缺乏知名度。
为了应对这一影评人涌入,烂番茄创建了“顶级影评人”称号,保留给《纽约时报》和《大西洋月刊》等知名媒体。然而,这一标签对电影的番茄计评分没有特殊影响,主要被纳入网站的辅助方面。烂番茄声称,这些新增影评人是为了通过包括更多女性、有色人种和代表性不足的群体来多样化其影评人群体——这一声明我无法证实或否认。但可以肯定的是,这些新影评人从根本上改变了网站的稳定状态,而平台几乎没有考虑到这一底层变化。也许影评评分的上升是一个愉快的意外,尽管时机极其可疑。
此外,这一新兴的、知名度较低的番茄计认证影评人群体已成为好莱坞制片厂的战略资产。根据2023年Vulture的分析,公关公司会积极争取来自较小媒体的影评人,以在电影上映前提高番茄计评分。显然,围绕招募非顶级影评人以在电影上映前获得“新鲜”标签,已经形成了一个小型产业。
尽管我没有硬数据来验证Vulture的说法,但人们可以看到,扩大的番茄计认证业余影评人群体可能容易被操纵。通过适当的影评人组合,可以在电影首映周末前设计出“新鲜”评分。
你可能会认为,在花了几小时解构番茄计后,我会坚决反对该网站所谓的(但也有些明显的)评分膨胀。然而,我的第一反应却奇怪地支持膨胀,这甚至让我自己都感到惊讶:也许烂番茄被(表面上)操纵并不是一件坏事?我并不为这一本能反应感到自豪,但它反映了2025年电影行业的现状。
在疫情之后,票房报道将每个周末都视为电影行业是否继续存在的公投。漫威能否重回巅峰?如果不能,是否意味着电影已死?A24能否单枪匹马拯救独立电影?如果不能,是否意味着电影已死?每周,电影要么“彻底过时”,要么“强势回归”,这令人疲惫。如果你热爱电影和影院体验,你最大的愿望就是让人们停止观看《爱情盲选巴西》,走出家门,去看电影。
于是,烂番茄登场了,这是一个有争议但有广泛影响力的网站,是影评赞誉的可疑代表。无论出于何种原因,人们信任这个平台,并会根据其推荐决定走出家门。烂番茄成为电视宣传的焦点,因为它可以在原本不存在需求的地方创造需求。
如果我是电影票务应用的拥有者或像Sam Bankman-Fried这样的病态功利主义者,我会认为目的证明手段的正当性:平均评分上升,更多电影被视为“新鲜”,人们走进影院,电影得以继续生存。不幸的是,我并不是一个病态功利主义者,这意味着我现在反对自己的最佳利益。为我欢呼吧。
短期内,膨胀的评分可能会吸引人们一两次走进影院。但从长远来看,如果人们在影院享受他们的体验(通过观看一部好电影),情况会更好。尽管我的第一反应支持膨胀,但我相信长期思维通常会胜出,而短期伎俩在回顾时总是“烂”的。尽管曾经被视为“烂”的东西现在被认为是“新鲜认证”,所以谁知道呢。
评论总结
评论内容主要围绕电影评分平台(如Rotten Tomatoes、IMDb等)的可靠性和使用体验展开,观点多样且存在争议。以下是总结:
对Rotten Tomatoes的批评
- 许多评论者认为Rotten Tomatoes的评分机制存在问题,尤其是“新鲜度”标准过于宽松,导致评分失真。
引用:- "the 3/5 = fresh thing has always been a pretty half-ass threshold"(3/5分即为“新鲜”的标准一直很敷衍)
- "RottenTomatoes has been rotten for over a decade"(Rotten Tomatoes已经烂了十多年)
- 政治倾向和营销手段可能影响评分,尤其是政治题材电影。
引用:- "The rankings are gamed because Rotten Tomato still carries some semblance of credibility"(评分被操纵,因为Rotten Tomatoes仍有一定可信度)
- "a bad film with a media approved message could get a really good score even if it sucked"(符合媒体口味的烂片也能获得高分)
- 许多评论者认为Rotten Tomatoes的评分机制存在问题,尤其是“新鲜度”标准过于宽松,导致评分失真。
对IMDb和其他平台的认可
- 一些评论者认为IMDb评分更可靠,尤其是随着时间的推移,评分趋于稳定。
引用:- "IMDb user ratings are much more useful, but still far from perfect"(IMDb用户评分更有用,但仍不完美)
- "A movie with more than 6 avg is usually enjoyable, while below 6 is not worth watching"(IMDb评分超过6的电影通常值得一看,低于6则不值得)
- 一些评论者认为IMDb评分更可靠,尤其是随着时间的推移,评分趋于稳定。
评分的主观性和局限性
- 评论者指出,评分受观众偏好、营销效果和选择偏差的影响,不能完全反映电影质量。
引用:- "audience scores... is very much an indicator of 'did the marketing connect to the intended audience?'"(观众评分更多反映了营销是否触达目标观众)
- "Would there be some selection bias as well?"(是否存在选择偏差?)
- 影评人和观众关注点不同,评分差异是正常的。
引用:- "Critics tend to care more about plot continuity, plot depth and details while the audience tends to care about enjoyability"(影评人更关注剧情连贯性和深度,而观众更注重娱乐性)
- 评论者指出,评分受观众偏好、营销效果和选择偏差的影响,不能完全反映电影质量。
个人化的观影策略
- 一些评论者倾向于根据特定导演、演员或类型选择电影,而非依赖评分平台。
引用:- "Follow specific actors/directors I really liked"(关注我喜欢的特定演员和导演)
- "I just attend my local independent cinema"(我只去本地独立影院)
- 也有评论者怀念过去基于封面或推荐选择电影的简单方式。
引用:- "I still miss the times when I would decide to watch a movie based on the cover at the VHS store"(我仍怀念根据VHS店封面选择电影的时代)
- 一些评论者倾向于根据特定导演、演员或类型选择电影,而非依赖评分平台。
对评分平台的改进建议
- 有评论者提出,可以根据个人偏好的影评人重新计算评分,以提高参考价值。
引用:- "What if we go and determine which of the critics are known to provide reviews that reflect our tastes"(如果我们根据个人偏好的影评人重新计算评分呢?)
- 还有人建议将评分整合到流媒体平台界面中,以便更好地选择内容。
引用:- "I’d love to have the Tomatometer score integrated into my UI for video streaming services"(我希望流媒体服务界面能整合Tomatometer评分)
- 有评论者提出,可以根据个人偏好的影评人重新计算评分,以提高参考价值。
总结:评论者对电影评分平台的看法分歧较大,Rotten Tomatoes因评分机制和政治倾向受到较多批评,而IMDb被认为更可靠。许多人认为评分受主观因素影响,建议根据个人偏好选择电影或改进评分机制。