AI编程助手调试能力不足?微软研究揭示背后原因

在科技飞速发展的今天,人工智能(AI)正在成为开发者们的新伙伴。GoogleCEO桑达尔·皮查伊透露,现在有四分之一的新代码是由AI生成的,而Meta的CEO马克·扎克伯格也表示了对AI编程模型的广泛兴趣。这似乎预示着AI将在编程领域大展拳脚。但是,当谈到解决软件漏洞这种棘手问题时,这些智能助手的表现却让人失望。

微软研究院最近的一项研究表明,即便是最先进的AI模型,在处理软件调试任务时也显得力不从心。这项研究测试了包括Anthropic的Claude3.7Sonnet和OpenAI的o3-mini在内的多款顶尖AI模型,使用名为SWE-benchLite的基准进行评估。结果表明,这些模型在面对精心挑选的300项软件调试任务时,表现不尽如人意。Claude3.7Sonnet的成功率勉强达到48.4%,而OpenAI的两款模型则更低,分别只有30.2%和22.1%。

那么,为什么这些聪明的AI在调试上如此挣扎呢?研究人员指出,主要问题在于数据不足。现有的训练数据缺乏足够的‘顺序决策过程’,也就是真实的人类调试活动记录。这意味着AI在模仿人类解决问题的方式时遇到了瓶颈。为了改善这一状况,需要专门的数据集来训练或微调AI模型,让它们更好地学习如何与调试工具互动,并理解工具是如何帮助定位问题的。

尽管AI已经在代码生成方面展示出了一定的能力,但其引入的安全漏洞和错误也不容忽视。例如,一款流行的AI编程工具Devin在20项编程测试中仅完成了3项。这说明,AI对于编程逻辑的理解还不够深入,容易产生错误。因此,虽然AI辅助编程有着巨大的潜力,但在将关键任务交给AI之前,我们仍需谨慎行事。

微软的研究提醒我们,编程不仅是一项技术活,更是一种艺术,它要求高度的创造力和问题解决能力。正如比尔·盖茨所说,编程作为一种职业将会持续存在。Replit CEO阿姆贾德·马萨德、Okta CEO托德·麦金农以及IBM CEO阿尔温德·克里希纳等业界领袖也都认为,人类开发者的角色不可替代。

随着AI技术的进步,我们可以期待它在未来编程领域能够扮演更加重要的角色。不过,我们也必须认识到当前AI的局限性,并且充分利用人类开发者的独特优势。唯有这样,才能确保编程技术不断向前发展,为我们的日常生活带来更多的便利。

说白了,现在的AI编程助手虽然能够帮助编写一些基础代码,但在复杂问题面前还是有点儿吃力。你知道吗?这就好比是给新手司机一个自动驾驶系统,它可以在直路上跑得挺好,可一旦遇到复杂的路况就可能不知所措。咱们是不是应该更加重视培养自己的编程技能,同时利用好AI这个新朋友呢?

Read More

杰克·多西和伊隆·马斯克希望“废除所有知识产权法”

Twitter(现为 X)和 Square(现为 Block)的联合创始人杰克·多西 (Jack Dorsey) 发表了一篇简短的帖子,宣称应“废除所有知识产权法”,引发了整个周末有关知识产权、专利和版权的争论。X 现任所有者埃隆·马斯克很快回复道:“我同意。”

image.png

目前尚不清楚究竟是什么引发了这些评论,但这些评论发表之际,包括 OpenAI(马斯克是 OpenAI 的联合创始人、竞争对手,并且正在法庭上挑战OpenAI )在内的人工智能公司正面临多起诉讼,指控他们侵犯了版权来训练他们的模型。

事实上,科技传播者兼投资者克里斯·梅西纳 (Chris Messina) 在撰文称多西“有道理”时就提到了这一点,因为“自动知识产权罚款/针对人工智能侵权的三振出局规则可能会取代将穷人因持有大麻而关进监狱的做法。”

其他人对这一论点不太认同,埃德·牛顿-雷克斯(Ed Newton-Rex,其创办的非营利组织 Fairly Trained 为尊重创作者权利的人工智能训练实践提供认证)将多西与马斯克的对话描述为“科技高管向那些不希望自己毕生心血被掠夺牟利的创作者宣战”。

作家林肯·米歇尔 (Lincoln Michel)写道: “如果没有知识产权法,杰克和埃隆的公司就不会存在”,并补充道:“他们就是讨厌艺术家。”

多西在随后的回复中详细阐述了他的立场,他写道,有“更好的模式来支付创作者的费用”,同时声称“目前的模式从创作者身上榨取了太多,而且只会寻租”。

当律师(前小罗伯特·F·肯尼迪的竞选伙伴)妮可·沙纳汉用大写字母“不”反驳时,他也表达了类似的观点。“知识产权法是区分人类创造和人工智能创造的唯一标准,”沙纳汉说道。“如果你想改革它,那就来谈谈吧!”

多西反驳道,“创造力是目前我们之间的区别,而现行制度限制了创造力,并将付款权交给了那些不公平支付的看门人。”

马斯克的回答至少与他过去的言论一致,例如他告诉杰·雷诺“专利是给弱者的”。

十年前,在所谓的“专利赠予”中,他承诺特斯拉不会对其他“善意”使用专利的公司强制执行专利。(该公司随后就专利问题起诉了澳大利亚的Cap-XX公司,但该公司表示,这是对Cap-XX公司针对特斯拉子公司提起的诉讼的回应。)

当然,多西发起了最终成为Bluesky的开放社交媒体项目,尽管他似乎对Bluesky感到失望,并最终离开了Bluesky董事会。(Bluesky首席执行官杰伊·格雷伯最近表示,多西的离开“解放了”公司,不再看起来像亿万富翁的副业。) 

还值得注意的是,Twitter/X 上的随机对话和实际政府政策之间的界限比以前更模糊了,马斯克加入了特朗普政府,并通过他的政府效率部推动大规模裁员——该部门以一个模因命名,主要由科技界人士组成。

Read More

天王星正在变化 哈勃20年延时摄影揭示其大气中的惊喜

哈勃太空望远镜已执行任务30多年,已被证明是研究遥远而神秘的冰巨星天王星的有力工具。通过20年来对这颗行星的反复观测,天文学家得以追踪其大气的长期季节性变化。这些观测为了解天王星大气的行为方式提供了新的见解——这些信息也可能有助于科学家更好地理解大小和成分相似的系外行星。

图片柱展示了STIS观测天王星四年间,在20年间的变化。在此期间,研究人员观察了天王星的四季变化:南极地区逐渐变暗,进入冬季阴影期;而北极地区则随着北半球夏季的临近而逐渐明亮。图片来源:NASA、ESA、Erich Karkoschka (LPL)

研究团队以多种方式分析了他们的研究结果。图像柱状图展示了STIS观测天王星20年间四年的变化。在这段时间里,研究人员观察了天王星的四季变化:南极地区(左图)在进入冬季阴影后变暗,而北极地区(右图)则随着北半球夏季的临近而开始更直接地出现在视野中,从而变亮。

最上面一行,在可见光下,显示了通过业余望远镜看到的天王星在人眼中的颜色。

第二行是该行星的假彩色图像,由可见光和近红外光观测结果组合而成。颜色和亮度与甲烷和气溶胶的含量相对应。在2002年哈勃望远镜的STIS首次瞄准天王星之前,这两种量都无法区分。通常,绿色区域表示甲烷含量低于蓝色区域,红色区域表示没有甲烷。红色区域位于边缘,天王星平流层几乎完全没有甲烷。

下面两行显示了从可见光到近红外光的1000种不同波长(颜色)推断出的气溶胶和甲烷的纬度结构。在第三行中,亮区表示云量较多,而暗区表示云量较多。在第四行中,亮区表示甲烷耗尽,而暗区表示甲烷含量充足。

天王星,这颗倾斜而神秘的冰巨星,终于在哈勃太空望远镜二十年的观测中开始揭开它的秘密。与旅行者二号提供的短暂一瞥不同,哈勃捕捉到了一个不断变化的世界,其特征是季节性光线的变化和剧烈的大气变化。数据揭示了两极附近意外的甲烷消耗、受太阳辐射影响的动态气溶胶变化,以及复杂环流模式的迹象。图片来源:NASA、ESA、Erich Karkoschka (LPL)

天王星是一颗遥远的冰巨星,它以剧烈的侧倾姿态绕太阳公转,是太阳系中最不寻常、最难理解的行星之一。如今,经过20年的开创性研究,科学家们利用美国宇航局的哈勃太空望远镜,发现了有关其大气成分和行为的新细节。这项长期研究得益于哈勃望远镜的高分辨率、先进的光谱工具和非凡的寿命。

这些发现为了解天王星大气如何运作以及如何应对阳光随时间变化提供了新的见解。这些扩展观测有助于科学家更好地理解这颗行星的天气模式和大气动力学,甚至可能为寻找类似大小的系外行星绕遥远恒星运行提供线索。

1986年,美国宇航局的“旅行者2号”探测器飞越天王星时,拍摄到了该行星的第一张近距离图像——一颗光滑的蓝绿色球体,看起来相对平淡无奇。相比之下,哈勃望远镜从2002年到2022年,对天王星进行了长达二十年的观测,揭示了其季节变化和更为复杂的大气层。在埃里希·卡科施卡(亚利桑那大学)、拉里·斯罗莫夫斯基和帕特·弗莱(威斯康星大学)的带领下,研究团队利用哈勃太空望远镜成像光谱仪(STIS)构建了该行星大气层变化的详细图像。

天王星的大气主要由氢和氦组成,还有少量甲烷以及微量的水和氨。甲烷对天王星的外观起着关键作用,它吸收了来自太阳的红光,使天王星呈现出淡蓝色。

这是旅行者 2 号飞船于 1986 年拍摄的天王星图像。图片来源:NASA/JPL-Caltech

哈勃团队在20年间对天王星进行了四次观测:分别在2002年、2012年、2015年和2022年。他们发现,与气态巨行星土星和木星的情况不同,天王星上的甲烷分布并不均匀。相反,甲烷在两极附近严重耗尽。这种耗尽在过去二十年中保持相对稳定。然而,随着2030年北半球夏至的临近,天王星的气溶胶和雾霾结构发生了巨大变化,北极地区亮度显著增强。

天王星绕太阳公转一周所需的时间略多于84个地球年。因此,在过去的二十年里,哈勃团队只观测到北半球的春季,因为太阳将从直射天王星赤道转向2030年几乎直射其北极。哈勃的观测表明,在此期间天王星上存在复杂的大气环流模式。对甲烷分布最敏感的数据显示,极地地区存在下沉,而其他地区则存在上沉。

在中低纬度地区,气溶胶和甲烷消耗具有其自身的纬度结构,在过去二十年的观测中,这些结构基本没有发生太大变化。然而,在极地地区,气溶胶和甲烷消耗的表现却截然不同。

在第三行中,北极附近的气溶胶呈现出急剧的增加,在北半球早春时节显得非常暗,近年来则变得非常明亮。随着太阳辐射的消失,左侧边缘的气溶胶似乎也消失了。这证明太阳辐射改变了天王星大气中的气溶胶雾霾。另一方面,在整个观测期间,两极地区的甲烷消耗似乎都保持在相当高的水平。

随着天王星进入北半球夏季,天文学家将继续对其进行观测。

2009年5月19日,哈勃望远镜由亚特兰蒂斯号航天飞机机组人员释放后,漂浮在地球上空。机组人员在五次太空行走中完成了所有计划任务,使“维修任务4”(SM4)——宇航员第五次访问哈勃太空望远镜——取得了圆满成功。图片来源:NASA

哈勃太空望远镜已经观测宇宙 30 多年,取得了我们这个时代最重要的一些天文发现。哈勃望远镜于 1990 年发射升空,是美国宇航局 (NASA) 和欧洲航天局(ESA) 的联合项目,至今仍是探索深空的最有力工具之一。哈勃的任务由位于马里兰州的 NASA 戈达德太空飞行中心管理,并得到位于丹佛的洛克希德马丁空间公司的支持,是一项合作成果。其科学操作由巴尔的摩的太空望远镜科学研究所执行,该研究所由大学天文研究协会运营。凭借其清晰的分辨率和先进的仪器,哈勃望远镜不断揭示有关星系、恒星、行星和宇宙基本性质的新见解。

编译自/ScitechDaily

Read More

↩️ 苹果正在研发两款新Vision Pro,但终极目标仍是AR眼镜 虽然首款Vision Pro市场反响平平,但苹果公司在重组其视觉产品团队后,仍在积极推进空间计算战略。据...

科技圈🎗在花频道📮:

苹果加码XR,Vision Pro二代产品进入生产阶段有望年内上市 苹果Vision Pro 已进入规模生产阶段,预计将于2025年内发布。据产业链消息,蓝思科技为Vision Pro 2提供玻璃面板,长盈精密提供外壳。尽管具体功能尚未透露,早期体验者表示,第二代产品在算力和显示方面有所优化。首代Vision Pro于2023年发布,定价3499美元,但由于销量未达预期和佩戴不适等问题,已于2024年停产。苹果计划将Vision Pro 2推向更广泛市场。 界面新闻 📮投稿 ☘️频道 🌸聊天

苹果正在研发两款新Vision Pro,但终极目标仍是AR眼镜

虽然首款Vision Pro市场反响平平,但苹果公司在重组其视觉产品团队后,仍在积极推进空间计算战略。据悉,苹果正开发两款新的Vision Pro头显:一款更轻、更便宜,以解决当前版本重量和价格过高的问题;另一款则专注于实现与Mac的超低延迟连接,面向专业应用场景。

然而,这些头显只是过渡产品。苹果CEO的长期目标,是研发出可全天佩戴的轻量化增强现实(AR)眼镜。该项目被库克视为重中之重,意图在Meta等竞争对手之前抢占市场。

彭博社

📮投稿 ☘️频道 🌸聊天

Read More

从自拍到科学:CERN 将你的日常手机摄像头变成反物质探测器

当物质和反物质碰撞时,它们会相互“湮灭”,将其质量转化为一股纯能量,释放出高能光子或粒子。由慕尼黑工业大学 (TUM) Christoph Hugenschmidt 教授领导的 AEgIS 合作项目的科学家们研制出了一种新型探测器,能够实时成像反物质湮灭点。

sciadv.ads1176-f1.jpg

MOS 传感器拍摄的反质子湮灭事件,观察到的形状与 Timepix3 探测器记录的形状相似,尽管比例大约小了 50 倍。通过拍摄背景图像,洋红色标记的像素被视为无效。绿色箭头表示椭圆形尖刺的示例,青色箭头表示粗轨迹的示例,橙色箭头表示细轨迹的示例。

《科学进展》杂志发表的一项研究中描述了这种装置,它能够精确定位反质子湮灭物质的位置,精度高达0.6微米(亚微米分辨率)。这比之前的实时成像方法精确35倍。

AEgIS 实验是欧洲核子研究中心反物质工厂研究的一部分,该工厂的研究团队正在尝试测量反氢原子在地球引力和重力加速度下的行为。“反氢实验:重力、干涉测量、光谱学”(AEgIS)是一项合作项目,汇集了来自欧洲和印度各地的物理学家。在当前阶段,该实验利用反质子减速器产生的反质子来产生反氢原子脉冲束。

AEgIS 通过产生水平反氢粒子束,并使用“莫尔偏转仪”等特殊工具检查其垂直运动来实现这一点。新开发的探测器记录这些湮灭点,以了解重力引起的粒子束路径的细微变化。

该研究的首席科学家弗朗西斯科·瓜蒂耶里(Francesco Guatieri)解释了高分辨率的重要性。“为了使AEgIS实验顺利进行,我们需要一个具有极高成像能力的探测器。我们使用的相机传感器像素小于一微米。通过组合60个这样的传感器,我们打造出了一个分辨率高达3840万像素的探测器——这是迄今为止所有成像探测器中像素数最高的。”

在此之前,研究人员只能依靠照相底片,但无法提供实时信息。新型探测器解决了这个问题,同时提供了类似甚至更好的图像质量。

为了制造该探测器,该团队使用了商用智能手机摄像头传感器,这些传感器已经证明可以实时捕获低能正电子。然而,他们必须对传感器进行重大调整,剥离某些专为手机电子设备设计的层。这一步骤需要先进的工程技术和精心的设计。

有趣的是,人工输入在这一突破中发挥了重要作用。该团队依靠同事的手动分析,在超过 2500 幅图像中精确绘制了反质子湮灭点。虽然这一过程耗时(每组图像最多耗时 10 小时),但在精度上却优于自动化方法。

据称,该探测器惊人的精度还能帮助科学家研究湮灭过程中产生的不同粒子。通过测量留下的轨迹,他们可以判断这些轨迹是由质子还是π介子引起的。这项新技术为研究低能反物质相互作用开辟了新的可能性。

AEgIS 发言人 Ruggero Caravita 强调了这一进展的重要性。“非凡的分辨率也使我们能够区分不同的湮灭碎片。新的探测器为低能反粒子湮灭的新研究铺平了道路,并且是一项改变游戏规则的技术,可用于观察引力引起的反氢原子的微小变化。”

尽管还需要更多的研究来充分发挥其潜力,但该探测器已经被誉为实验物理学领域的变革者。

资料来源:CERNScience Advances

Read More