开发者生态
morning
检查你他妈的消息来源,人们
2026-05-15
1 阅读
flail
检查一下你他妈的资源,朋友们!由 Pawel Brodzinski 于 2026 年 5 月 15 日在 ai 上发表,对不起。这是吐槽。看标题你可能已经猜到了,呵呵!压垮我脊背的最后一根稻草是我看到的线索:“瑞典制造了智能机器,乌鸦用垃圾换取食物,将聪明的鸟类变成了意想不到的城市清洁工。”明显由人工智能生成的图像并不能提高可信度(三足乌鸦很能说明问题),但正是标题促使我进行了搜索。不过,“搜索”是一个很大的词。这实际上只是一个查询。不是瑞典,而是一家瑞典初创公司。尚未建成,但进行了一次试点。而且它并没有接近将乌鸦变成城市清洁工,因为该项目被放弃了,后续行动为零。事实检查在这里。然而,如果你想将某人的注意力吸引到你的明显由人工智能生成的 LinkedIn 帖子上,并试图推销一些东西(我不知道到底是什么;一旦看到人工智能生成的图形,我就会被激励停止阅读),那么它肯定会起到养眼的作用。链接不再意味着可信度 乌鸦清洁工的故事虽然可能很有趣,但不会让我写一篇文章。事实上,虚假参考资料已经成为令人烦恼的问题已有相当长一段时间了,所以这只是“其中的另一个”。这是一个更有趣的案例。最近,我读了一篇关于人工智能编码的故事,其中充满了支持作者主张的数据。一个具体事实如下:“SmartBear/Cisco 研究确定了每个人都忽略的数字:缺陷检测率从 100 行以下 PR 的 87% 下降到 1,000 行以上 PR 的 28%。”凉爽的。这是我现在正在研究的事情。让我们看一下这项研究,看看我能从数据中学到什么。 Ops,该链接不会指向该研究,而是指向另一篇文章。但那篇文章有自己的链接。这导致另一篇文章甚至不再提及这项研究。顺便说一句,链接链中的两个网站都没有提到原始报价中的数字。我敢打赌它们是人工智能生成的,没有经过任何人类验证。即使是一个稍微有能力的人也会发现这种不一致。作者显然渴望达到更高的专业水平,而不仅仅是“中等能力”。源数据通常是幻觉的嫌疑人 现在,SmartBear/Cisco 研究很容易通过谷歌搜索,因此最终链接链只是一个小麻烦。然而,阅读这篇论文是一次启发性的经历。研究中没有任何一个地方声称特定拉取请求大小的检测率为 87% 或 28%。在整个数据样本中,几乎没有任何数据点的 PR 大小超过 1,000 行代码。最后,本文没有明确地将缺陷检测作为分析参数来衡量(它使用缺陷密度并得出一些关于检测率的结论)。换句话说,原文章中的整个主张一定是幻觉。在作者的辩护中,SmartBear/Cisco 研究推断较长的 PR 可能会导致更差的缺陷检测。但它既不明确也不直接地提出这一主张。 “检查速率低于 300 LOC/小时可实现最佳缺陷检测。速率低于 500 仍然不错;如果比这更快,预计会漏掉相当大比例的缺陷。”角度是每小时审阅的行数,而不是PR大小。由此推断,较大的 PR 需要更长的时间,并且当需要更多时间时,审阅者有一种明显的加快流程的趋势。反过来,审查的速度与缺陷密度成反比。这与“缺陷检测率从 87% 下降到 28%”相差甚远。人工智能在边缘失败 这是人工智能在边缘不可靠的完美例子。没有特别庞大的“SmartBear/Cisco 研究”数据样本或显示特定代码审查动态的研究。对于法学硕士来说,这已经意味着边缘。如果我们在自动驾驶仪上运行人工智能,它肯定会带来结果。在可能的情况下,当法学硕士找不到相关答案时,它会产生幻觉。它很乐意弥补这些数字。他们看起来会很好。具体的。声音。如果运气好的话,它们甚至可能(在某种程度上)与消息来源的实际说法一致。但事实真的如研究报告所述吗?众所周知,“所有统计数据中有 73.6% 是编造的。”我建议补充一句:“自从人工智能广泛采用以来,这一比例上升到了 86.9%。”可悲的是,我们越多地将数据研究外包给人工智能,我的讽刺可能就越准确。而且情况只会变得更糟。带有虚构数字的原始文章很快就会被另一位法学硕士用作可信的文章。毕竟,看起来像一个。链接链的长度将增加一,为未来的人工智能查询添加更多的自我强化噪音。干得好,大家!信誉是我们的货币 好吧,我知道。我不会扭转局势。 AI 垃圾将继续存在。算法会奖励它。写一篇文章大约需要我几个小时。如果我需要研究背景事实,请提供更多信息。增加一些后期编辑的时间。 ChatGPT 可以为我做到这一点