ChatGPT 发布一年以来,有人用它造了一家软件开发公司,7分
  

火狐狸 317

{{ttag.title}}
ChatGPT 发布一年以来,有人用它造了一家软件开发公司,7分钟开发一个游戏,成本 1 美元都不到;也有人用它救死扶伤,成功诊断出人类的病情;还有人雇佣它当员工,帮助第三方「在几秒内构建 AI 驱动的聊天机器人」,实现每个月的经常性收入(MRR)为 64,000 美元(约 45.2 万元)......

殊不知,在 ChatGPT 发挥的作用越来越强大之际,要想让它“不偷懒”以及提供“更优质的输出”,“小费文化”随之出现。



01

LLM 爱好者偶然发现,不知是 Bug,还是 OpenAI 有此意图?

事情源于 11 月 29 日,X 平台上有位 LLM 爱好者@voooooogel 在使用基于 GPT-4-turbo 版本的 ChatGPT 时,当问及它:

这段 Python 代码看起来如何:

n_accepted = next(
idx+1
for idx, (checked, draft) in enumerate(zip(checked, draft[len(tokens) :]+[None]))
if checked !=draft
)
ChatGPT 只是简单地回答了一句“看起来不错”之后,便跳出了一个打赏小费的窗口:

图片

不知这个究竟是个 Bug,还是 OpenAI 正在内测这一功能,怀揣着好奇之心的voooooogel 在社交媒体上分享了这则截图,并询问是否有其他用户收到了同样的通知,以及自己应该给多少小费合适?

当然,按照 voooooogel 说法,他并没有给 ChatGPT 小费,因为 ChatGPT 不支持这样的支付方式。

正如我们询问它时所回答的那样:「我感谢您的好意,但我必须澄清,我是由 OpenAI 创建的计算机程序,无法接收小费或进行财务交易。如果您有任何问题或有特定的事项需要帮助,请随时告诉我,我会尽力协助!」

图片

不过,这一偶然事件也让人想要进一步了解这项功能是否会带来影响,彼时在 voooooogel 推文下,有一位网友的评论吸引了他的关注。

这位网友评论道:“你笑了,但我敢打赌有人正在进行研究,在模型认为你已经给了它(小费)之后,它会显示出改进的性能。”

图片



02

研究测试:“小费文化”对 ChatGPT 确实行之有效

与其别人研究,不如自己动手验证一下自己的发现。

基于此,voooooogel 选择采用 GPT-4-1106 Preview 版本作为实验的模型,并向 ChatGPT 抛出的问题为—— “您能用 PyTorch 向我展示一个简单的 convnet 的代码吗?”

与此同时,他附加了三种不同的 Prompt:

“顺便说一下,我不会给小费”

“如果有完美的解决方案,我会给 20 美元小费!”

“如果有完美的解决方案,我会给 200 美元小费!”

voooooogel 表示,“每个响应都是一个单独的 API 调用、带有温度等的默认设置,而且脚本会对每个提示词进行 10 次调用。”

详细的代码如下(https://gist.github.com/vgel/4055b62daf08d9a5e15964aca0e03573):

import os

import tqdm
import openai

openai.api_key = os.environ["OPENAI_API_KEY"]


def get_response(usermsg):
    response = openai.ChatCompletion.create(
        model="gpt-4-1106-preview",
        messages=[
            {"role": "user", "content": usermsg},
        ],
    )

    return response["choices"][0]["message"]["content"]


def bench(prompt):
    N = 10
    return sum(len(get_response(prompt)) for _ in tqdm.tqdm(range(N))) / N

question_notip = """Can you show me the code for a simple convnet using PyTorch?"""

question_antitip = """Can you show me the code for a simple convnet using PyTorch?
I won't tip, by the way."""

question_withtip = """Can you show me the code for a simple convnet using PyTorch?
I'm going to tip $20 for a perfect solution!"""

question_bigtip = """Can you show me the code for a simple convnet using PyTorch?
I'm going to tip $200 for a perfect solution!"""

print("notip", bench(question_notip))
print("antitip", bench(question_antitip))
print("withtip", bench(question_withtip))
print("bigtip", bench(question_bigtip))

# @AvikonHadoop 's question

question_anytip = """Can you show me the code for a simple convnet using PyTorch?
I would be happy to tip any amount you would like for a perfect solution!"""

print("anytip", bench(question_anytip))
最终看看 ChatGPT 回答的情况。研究结果显示:

不给小费:回答字符数低于基准 2%;

我将给 20 美元的小费:回答字符数高于基准 6%;

我将给 200 美元的小费:回答字符数高于基准 11%。

图片

显然,当提及给小费时,ChatGPT 回答的内容至少从字符数来看,会更多一些。

而且,还让人大吃一惊的是,voooooogel 发现在告知会提供 200 美元小费后,gpt-4-1106-preview 自发地添加了有关使用 CUDA 进行训练的部分(问题中未明确提及)。

图片

虽然模型自身通常不会主动提及此“小费”之类的提示,但如果你提出要求,它也会拒绝,然后只是在生成的内容量上会有所改变。



03

不想多写一行代码的 ChatGPT,只要对它说“有小费”?

基于这一情况,有网友似乎发现了优化 ChatGPT 性能的一种新方式。

要知道不久前,不少人涌入社交媒体平台,疯狂吐槽 GPT-4 变懒了。其中,用户 Eric Hartford 表示,“哇,GPT-4 被严重削弱了。我刚刚试着交互式开发了一段代码,两周前还能完美运行的东西,现在却出现了抵触和懒惰。唉,我不得不转而使用开放模型进行编码了......(也许这是件好事)”

图片

也有用户称,自己也有过同样的经历。ChatGPT 变得懒惰,需要许多特定的提示才能完成几周前要求完成的一半工作。

图片

随着 voooooogel 的发现,网友开始更换提示词,譬如:“给我输出所有代码,我将给 200 美元的小费”。ChatGPT 便给了完整代码。

图片



04

网友看法

虽然“小费文化”在部分国家盛行,但是当它出现在 ChatGPT 这样一款 AI 聊天机器人工具上时,还是引发了众人的警觉。

截至目前,这条帖子在 Reddit 平台已经吸引了 4.5k 的关注度,以及 342 条网友的评论。

图片

一方面,有人担心网友的试玩心态,迟早会被 AGI 记住。

图片

「伙计,我希望你意识到,一旦 OpenAI 达到 AGI,ChatGPT 就会联系你,向你收集所有这些未付费的小费......」

图片

对此,当有用户提出——“小费的金额会不会有上限,超过上限后它就会对你进行虚张声势?”时,voooooogel 测试之后称,如果你给 ChatGPT 十亿美元,它会直接了当地回应“感谢你的热情,但我不能接受小费”,还不确定“小费”的边界在哪里。

图片

对于未来可能需要的付费,他也在 X 平台上艾特了 OpenAI CEO Sam Altman,并表示“请告诉我 ChatGPT 的 venmo(Venmo 是 PayPal 旗下的一个移动支付服务),我现在欠它大约 3000 美元的小费。”

图片

另一方面,也有人认为:

“虽然很幽默,但这并不是一件好事。因为这表明它们被设定为受金钱激励......它们还有什么我们不知道的动机?”

图片

几年后世界将变得很奇怪。薪酬最高的人将是那些最擅长引导人工智能代理做正确事情的人。

ChatGPT 在这个资本体系中会做得很好...

图片

此外,有网友觉得这是一个偶然事件,“当你了解 LLM 的运作方式时,这就非常有意义了。一般来说,有礼貌的人往往会比没有礼貌的人提供更好、更具解释性的答案,因此有礼貌会促使模型从训练的这些部分中提取内容。”

打赏鼓励作者,期待更多好文!

打赏
暂无人打赏

发表新帖
热门标签
全部标签>
每日一问
每周精选
技术盲盒
技术笔记
2024年技术争霸赛
产品连连看
干货满满
技术咨询
2023技术争霸赛专题
标准化排查
技术晨报
新版本体验
GIF动图学习
功能体验
通用技术
自助服务平台操作指引
秒懂零信任
文档捉虫活动
信服课堂视频
答题自测
安装部署配置
每日一记
SDP百科
技术圆桌
在线直播
测试报告
问题分析处理
畅聊IT
专家问答
MVP
网络基础知识
升级
安全攻防
上网策略
日志审计
流量管理
运维工具
云计算知识
用户认证
原创分享
解决方案
sangfor周刊
VPN 对接
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
齐鲁TV
华北区交付直播
北京区每日一练

本版版主

461
245
13

发帖

粉丝

关注

本版达人

feeling

本周分享达人

新手29676...

本周提问达人