你都被ChatGPT白嫖了,还得给它数钱
出品|虎嗅科技组
(资料图片)
作者|齐健
编辑|陈伊凡
头图|FlagStudio
“谷歌计划在旗舰搜索引擎中添加对话式人工智能功能,这将引导公司应对来自ChatGPT等聊天机器人的竞争和更广泛的业务压力。”谷歌首席执行官Sundar Pichai在近日的一次采访中表示,AI并不会对谷歌的搜索业务构成威胁,相反,人工智能的进步会增强谷歌搜索查询的能力。
然而,在高调推动研发的同时,谷歌的经济状况却并不乐观。自2023年1月宣布裁员12000人(占Alphabet总员工6%)之后,近日,谷歌首席财务官Ruth Porat又向员工表示,预计将从餐饮设施到公司计算基础设施等领域削减更多支出。有趣的是,谷歌称“这对开发和运行强大的人工智能算法至关重要”。
就在谷歌“砸锅卖铁”研发大型语言模型(LLM)的同时,ChatGPT及类似的LLM们,也开始“大杀八方”。
近日,美国就业服务平台Resume Builder公布的一项调查统计显示,在1000多家受访美国企业中,有48%的企业已经在用ChatGPT取代人类员工。
新闻出版业感受到了这场冲击波。今天的AI越来越让人深刻体到会什么叫“教会徒弟饿死师傅”。正在抢走你工作岗位,替代你的ChatGPT们,其实正是在无数遍调用你的工作数据之后,利用你的这些工作成果训练出来的。
而媒体行业的老板们也正在思考如何执行“打不过就加入”的策略,他们希望尝试跟微软、OpenAI、谷歌这样的AI研发公司分分ChatGPT的“钱”。
3月23日,美国新闻集团旗下媒体华尔街日报报道,有知情人士透露,最近几周,美国出版行业的高管们对于ChatGPT的爆火也坐不住了。他们正在研究出版集团们的内容在多大程度上被用于“培训”ChatGPT等人工智能工具。
一场针对版权、法规的争论正在展开。
每个码字工可能都被ChatGPT白嫖了
对此,美国新闻媒体联盟的高层们讨论的核心是人工智能公司是否有合法权利从互联网上抓取内容,并将其用于他们的AI大模型训练。而目前,美国有一项名为“合理使用”的法律条款,似乎允许AI公司在某些情况下,使用未获授权的版权材料。
“我们有有价值的内容,而现在,这些我们花费人力、财力创造的内容,正在不断被用于为其他人创造收入。”美国新闻媒体联盟执行副总裁兼总法律顾问Danielle Coffey认为,在这个问题上,新闻出版公司理应得到经济补偿。
OpenAI首席执行官Sam Altman在此前接受的采访中曾表示,“我们在合理使用数据方面投入很大,我们愿意为某些领域的高质量数据支付大量费用。”例如科学领域。在必要时,OpenAI已经就内容达成了协议。
事实上,“版权”的概念在互联网诞生之际就发生过一次变革,“分享”的概念随着互联网的高速传播能力打破了很多版权商对内容的垄断。此后,版权之争更是成为了内容生产者、分发渠道、广大用户以及利益链上的各个相关实体不可避免的争议话题。
美国新闻集团对AI主要的担忧在于,人工智能工具可能会耗尽其网站的流量和广告资金。目前,微软提供的NewBing,会在用户问题的答案中包含链接。然而美国出版商的高管表示,有多少用户实际上会点击这些链接并访问他们的网站,这是一个很难确定的问题。
事实上,AI可能确实会影响用户对版权内容的阅读。Bing Chat可以针对网站内容给出全面的总结分析式回答,从而大幅降低了用户点击原文链接的欲望。在对Bard的测试过程中,虎嗅发现,只要给Bard提供链接,它就可以直接为用户解读网页内容,包括一些需要付费浏览的内容。不过由于Bard目前只支持美国和英国地区用户,所以它目前只能解读这些国家的网站。
谷歌的Bard通过网址解读美媒The information的付费新闻
目前,美国出版商行业组织新闻媒体联盟已经开始与微软和谷歌的代表会面,并主张自己的权利,要求AI训练公司为数据、内容付费。如果谈判效果不理想,这些出版集团也不排除在该问题上诉诸法律。
ChatGPT们的学费该怎么交
从OpenAI目前透露的信息来看,在GPT-3的训练过程中,很多数据是来自开源数据组织Common Crawl利用爬虫抓取的数据。
Common Crawl是一个501非营利组织,它利用爬虫对网络进行抓取,并向公众免费提供其档案和数据集。Common Crawl的网络存档包含自2011年以来收集的PB级数据。通常每个月都会完成爬网。Common Crawl由Gil Elbaz创建。该非营利组织的顾问包括Peter Norvig和Joi Ito。
Common Crawl的数据使用条款中要求不可将数据用于非法用途,以及如下事项:从事辱骂、骚扰、仇恨或其他冒犯性活动;侵犯他人隐私;危害未成年人;侵犯他人的权利(IP、专有等);规避复制保护;干扰或破坏我们的网站、服务或安全;垃圾邮件的人;跟踪人;冒充他人或以其他方式伪装您的身份;伪造标题或以其他方式伪装我们的内容;收集个人身份信息;为商业招揽而沟通。
虽然未提及不可用于商业用途,但Common Crawl的使用协议中,也声明了要求保护版权、商标等。所以,对于版权所有方提出的付费要求,使用了版权数据的AI大模型研发公司,理应回应付费或是补偿需求。
不过,从长远来看,这个付费模式,对于AI大模型来说恐怕还有很大的讨论空间。毕竟AI大模型在学习了版权数据之后可能创造的价值,远大于一次性版权付费。而出版社或许更关注他们的版权内容,在AI工具中是否有侵权性的展示和露出,从而以此与AI工具的研发者建立长期分利的分利模式。
“生成式AI通常不会直接展示学习到的内容,他都会进行总结提炼,或是转化成自己的话叙述给你。”西湖心辰COO俞佳告诉虎嗅,AI大模型本身不存储数据,它存储的是参数。而参数代表着在算法、模型框架之下,数据之间的关系。因此AI输出的内容,通常情况下都不会是原本的数据或内容的复刻,也就很难界定是否侵权了。
此外,俞佳认为,深度学习的底层逻辑是“学习”,对于版权内容的一次性付费是合理的,但长期付费需要更创新的版权人收益模式。“对于知识来说,AI和人有些相似。比如说,我看了一本书,然后我用书里学到的知识赚到了钱,那么我需不需要或者应该用什么方式来回报这本书的作者?这需要创新的解法”
由于国内AI大模型研发和应用相对于国外来说起步稍晚了一些,且ChatGPT官方尚不支持中国地区的应用。所以AI暂时还没有触碰到国内出版商的利益,国内相关机构也尚未对此提出大规模的公开质疑。
虎嗅为此询问了一些出版行业专业人士,某国内出版社资深法务专家表示,“国内版权保护意识基础较为薄弱,在很多环节还跟不上。虽然现在ChatGPT对中国出版业界还没有构成明显的威胁,但对AI的版权问题和生成式内容的权属界定问题,已经被行业广泛关注了。”
“新闻报道在国内的相关的法律当中,特别是著作权法,是享有著作权的。”观韬中茂律师事务所合伙人王渝伟向虎嗅介绍说,AI大模型利用享有著作权的内容去进行非营利性的科学研究问题不大,但是一旦商用,就需要为这部分内容支付相应的许可费用。
不过,王渝伟也表示,目前AI大模型训练对于版权内容的使用与否,用了多少,都很难界定。因此,很难在法律上对著作权人提供有效的保护。但这显然不能成为侵权,或者说不付费、不许可的前提条件。不过具体到出版商或著作权人,如何与AI研发者分成,可能还需要双方接触,谈判确定。在这方面短期来看,法律也不会直接给出规定的数额。
吃我饭,还砸我碗?
在讨论该如何向ChatGPT收学费的同时,出版商或许更加担忧ChatGPT的生成能力可能会威胁到新闻出版集团的主业。这也使得AI在出版集团面前的形象成了——“吃我饭,还砸我碗”。
最新发布的GPT-4众多亮点中,就包括在大量专业技能考试中取得超越人类平均水平的成绩,在很多执业资格考试中,甚至超过90%的人类考生。由此,人们自己会否被AI取代的担忧日益加深。
2023年1月,还处在舆论升温阶段的ChatGPT,已经被美国版今日头条Buzzfeed注意到,并第一个声称将在未来一年中把ChatGPT能力全面应用到内容生产中。此后,Buzzfeed股价连日大涨,资本对AI替代人类编辑记者的想法,可谓是非常看好。
此后不久,在3月初,Buzzfeed就开始利用ChatGPT进行内容生产了。用一个名为“Buzzy the Robot”的名字发布了40多份旅游指南,目的地包括斯德哥尔摩、布拉格和大阪等。
不过,有细心的网友在阅读之后发现,Buzzy机器人撰写的文章中,有五分之一的都采用了几乎相同的开头。这些文章通常以“Now, I know what you are thinking(现在,我知道你在想什么)”这句话开头,然后是关于该特定目的地的反问句。例如:“I know what you’re thinking: isn’t Stockholm that freezing, gloomy city up in the north that nobody cares about?”( 我知道你在想什么:斯德哥尔摩不是那个寒冷、阴暗的北部城市,没有人关心吗?)
对此,有人认为,AI作者在写文章方面,要比人类“懒”得多。不过,从AI目前在内容生产领域的表现来看,这项专业技能或许尚不足以直接威胁到相关从业者。
在ChatGPT以及类似的LLM生产内容的过程中,还有一个很难跨越的问题,那就是准确率的问题。虽然GPT-4在这方面已经有很大改进,但仍然无法摆脱GPT模型生成内容的固有模式。
GPT模型的内容都是根据上下文一个字一个字地生成的,因此面对人类的提问,AI模型的目的就是回答,写完这段话,而它不会对内容负责。在很多他不是很清楚的问题上,AI还不能做到对每个问题停下来,问问人类这是什么?这是怎么回事?或是质疑人类的观点。
除此以外,现阶段人类大脑对于AI最大的优势可能还是“廉价”。目前ChatGPT的API价格是$0.03/1000个prompt tokens,$0.06/1000个completion tokens。GPT-4的API报价是$0.03/1000个prompt tokens,$0.06/1000 个completion tokens。相比之下,人类员工坐在电脑前时,只要你够卷,他可以为你提供低价的无限token算力。
同时,这位人类员工还具备AI很难实现的理解和学习的能力,在面对新事物时人类拥有创造力和主观判断力。而AI在这方面的能力显然还很不够,毕竟GPT-4只是发布了一个识别梗图的功能,就已经让全世界兴奋到恐惧了。
正在改变与想要改变世界的人,都在虎嗅APP
标签:
相关文章
你都被ChatGPT白嫖了,还得给它数钱
AI输出的内容,通常情况下都不会是原本的数据或内容的复刻,也就很难界定是否侵权了。观韬中茂律师事务所合伙人王渝伟向虎嗅介绍说,AI大模型
上千辆三、四轮车销毁!允许生产,为何禁止使用?受伤的总是车主
上千辆三、四轮车销毁!允许生产,为何禁止使用?受伤的总是车主,四轮车,电动车,三轮车,老年代步车,全国机动车保有量
酵母粉和泡打粉一起怎么用?酵母粉和泡打粉有什么区别?|全球报道
酵母粉和泡打粉一起怎么用如果既放泡打粉又放发酵粉,泡打粉里的小苏打属碱性,它会抑制发酵粉中的酵母的生长,所以一定要注意不能两样同时
天天即时:女足国际友谊赛:中国队0-0战平瑞士队
据央视新闻消息,北京时间4月7日凌晨,一场女足国际友谊赛在瑞士卢塞恩进行,对阵双方分别是中国女足和瑞士女足。两队在比赛中
非甾体消炎药痛风_非甾体消炎药
今天小编肥嘟来为大家解答以上的问题。非甾体消炎药痛风,非甾体消炎药相信很多小伙伴还不知道,现在让我们一起来看看吧!1、非甾体抗炎药(non
排卵同房后要注意什么才容易着床_排卵监测一般要做几次
1、排卵监测次数需要根据b超指示的卵泡大小和卵泡生长情况来确定。通常在月经第10-12天进行3-4次系统的周期性监测。但
华原股份2022年净利3844.29万同比下滑10.05% 信用减值损失同比增长
挖贝网4月6日,华原股份(838837)近日发布2022年年度报告,报告期内公司实现营业收入504,572,454 36
新一轮冷空气来袭,这些地方再迎降温
今天(4月6日),中东部今年以来最大范围雨雪天气进入收尾阶段,但长江以南地区仍有较大范围降雨,明天起中东部雨水暂歇,多地阳光回归。受新
今日快讯:联合水务换手率81% IPO募资2.5亿2022年净利降约8%
联合水务(603291 SH)今日盘中股价开板,最低报15 88元,此后再度封板。截至收盘,联合水务报16 45元,上涨
在中国斡旋下沙特和伊朗外长在北京首次会晤_世界观天下
作为今年3月10日沙伊北京对话的后续,沙特外交大臣费萨尔和伊朗外交部长阿卜杜拉·希扬6日在北京举行会晤,这是两国外长7年多来的首次正式...
天津市全面提升各级医院核心竞争力 以目标为导向提高医疗质量
今年我市将进一步加强医疗质量安全管理,通过卫生健康行政部门、医疗机构、各级质控组织和行业学协会协作,以目标为导向开展医疗质量安全改进
格力地产:本次重大资产重组的盈利承诺系免税集团管理层基于标的公司目前的运营能力和未来的发展前景做出的综合判断 世界报道
同花顺金融研究中心4月6日讯,有投资者向格力地产提问,陈董好,自疫情放开以来,口岸客流大幅增长,能否介绍下免税集团在2023年某月或第一季
最资讯丨沈阳站和沈阳北站区别_沈阳站跟沈阳北站有什么区别
1、展开3全部车站地址不同沈阳北站位于辽宁省沈阳市沈河区北站路102号。2、沈阳站位于辽宁省沈阳市和平区胜利南街2号。
港股异动 | 汽车股早盘普跌 蔚来-SW(09866)跌超6% 机构指车市短期经营压力提升_每日短讯
汽车股早盘普跌,截至发稿,蔚来-SW(09866)跌5 8%,报70 7港元;小鹏汽车-W(09868)跌4 46%,报39 6港元。
广东建成母婴室9492间 深圳东莞等地还将推广移动母婴室_全球热闻
读特客户端·深圳新闻网2023年4月6日讯(深圳特区报驻穗记者陈行)为保障母婴权益,公共场所母婴室建设被列为广东省“十四五”规划纲要和广...
云南屹杰建设工程100%股权三次挂牌转让,底价138万元_最新快讯
乐居财经邓如菲4月6日消息,据全国产权行业信息化综合服务平台,云南屹杰建设工程有限公司100%股权三次挂牌转让,转让底价为138万元。转让方为
工信部通报扫码支付新骗局,究竟是怎么一回事?
正文摘要:3 时刻保持清醒的头脑,在网络上涉及金钱的,一定要谨慎谨慎再谨慎!工信部通报扫码支付新骗局究竟是怎么一回事,跟
世贸组织预测今年全球商品贸易量增长将放缓至1.7%
当地时间4月5日,世界贸易组织发布新的《全球贸易展望与统计》报告。报告预计,2023年,全球商品贸易量将增长1 7%。这一增幅低于2022年2 7%的
当前简讯:为何产油国突然集体减产 到底怎么回事??
央广网北京4月5日消息据中央广播电视总台经济之声《交易实况》报道,沙特、俄罗斯等多个产油国日前宣布,从5月起到今年年底
摩根大通首席执行官:美国银行业危机影响将持续数年
[新闻页-台海网]美国最大金融服务机构之一的摩根大通首席执行官杰米·戴蒙当地时间4日在写给股东的年度信函中表示,由硅谷银
【当前热闻】传承英模精神 | 重启封存11年警号 继续履行铿锵誓言
传承英模精神|重启封存11年警号继续履行铿锵誓言---2012年6月19日,在连续工作十多天之后,突发疾病倒在工作岗位上,经抢救无效,因公殉职,年
记忆中遥远的春天歌词_记忆中遥远的春天-世界焦点
1、这个也让人很难过,结局虽然是HE,但是人物的感情太纠结了。2、草根少年和王子病少年住在一个屋檐下,起初王子是看不上草