OpenAI计划在未来几个月内发布一款新的“开源”语言模型

OpenAI 表示,“在未来几个月内”,它打算发布自 GPT-2 以来的首个 “开源” 语言模型。这一消息来自该公司周一在其网站上发布的一份反馈表格。OpenAI 邀请 “开发者、研究人员以及更广泛的社区成员” 填写这份表格,其中包含诸如 “你希望在 OpenAI 的开源权重模型中看到什么?” 以及 “你过去使用过哪些开源模型?” 之类的问题。


OpenAI 在其网站上写道:“我们很高兴能与开发者、研究人员以及更广泛的社区合作,收集各方意见,让这个模型尽可能地实用。如果你有兴趣参加 OpenAI 团队的反馈会议,请在下面的表格中告知我们。”

OpenAI 计划举办开发者活动以收集反馈意见,并且在未来展示该模型的原型。首次活动将在几周内于旧金山举行,随后还会在欧洲和亚太地区举办类似活动。

OpenAI 正面临着来自竞争对手日益增大的压力,这些竞争对手在推出模型时采用了 “开源” 的方式。与 OpenAI 的策略不同,这些 “开源” 竞争对手将他们的模型提供给人工智能社区用于实验,在某些情况下还用于商业化。

事实证明,对于一些机构而言,这是一种非常成功的策略。Meta 在其开源人工智能模型 Llama 系列上投入了大量资金,该公司在 3 月初表示,Llama 的下载量已超过 10 亿次。

在最近的一次 Reddit 问答活动中,奥特曼(Altman)表示,他认为在开源其技术方面,OpenAI 站在了历史错误的一边。

奥特曼说:“(我个人认为我们需要)想出一种不同的开源策略。并非 OpenAI 的所有人都认同这一观点,而且这也不是我们目前最优先考虑的事项……(展望未来)我们将开发出更好的模型,但我们不会像前几年那样保持领先优势。”

当地时间周一下午,奥特曼在 X 平台上进一步阐述了 OpenAI 的开源模型计划,他表示即将推出的开源模型将具备类似于 OpenAI 的 o3-mini 的 “推理” 能力。

奥特曼称:“在发布之前,我们会像对待其他任何模型一样,根据我们的准备框架对这个模型进行评估。鉴于我们知道这个模型在发布后会被修改,我们会做额外的工作…… 我们很期待看到开发者会用它来构建什么,以及大公司和政府在更倾向于自己运行模型的情况下会如何使用它。”

Read More

🖼 微软关闭上海人工智能实验室 地缘紧张下加速撤离中国市场 微软已悄然关闭位于上海张江高科技园区的物联网与人工智能实验室,该实验室曾作为微软与浦东区政...

微软关闭上海人工智能实验室 地缘紧张下加速撤离中国市场

微软已悄然关闭位于上海张江高科技园区的物联网与人工智能实验室,该实验室曾作为微软与浦东区政府合作的旗舰项目,五年间支持过258个本土科技项目并促成94亿元外部融资。此次关闭是微软在华战略收缩的最新动作,此前该公司已对700-800名中国AI员工提供外迁选项,并全面撤出中国大陆实体门店,目前中国市场仅占其全球营收约1.5%。

来源:南华早报

Read More

iOS/iPadOS 上的浏览器下载个普通的视频好麻烦

toboro:

视频是 mp4 格式,位于内网的服务器。服务器是用 Nginx 简单配置的,加了基础的 HTTP 认证。

在 iPad 上平常用 Chrome 浏览器,找不到下载 mp4 视频的方法。长按 mp4 视频链接,弹出的菜单中没有下载的选项。点击链接会直接播放视频,长按视频只会选取文字不能下载,点击右上角的分享按钮也没有保存的选项。而如果是 mkv 文件,因为不支持直接播放,反而会弹出下载的提示,能够正常下载。支持播放的格式不能下载,不支持播放的却能够下载,感觉很讽刺。

Safari 长按 mp4 视频链接倒是有下载的选项,但是由于有 HTTP 认证,下载下来是一个 HTML 页面,显示 "401 Authorization Required",即使在打开视频列表页面时已经认证过了。直接点击链接会播放视频,通过分享按钮能保存文件,但是得到的同样是 401 页面。mkv 文件直接点击能够正常下载,长按链接下载得到的也是 401 页面,说明长按链接下载和通过分享保存不能利用已经认证的会话。看到其他帖子中提到了 stay 插件,试了一下保存文件竟然还需要点数或者开通订阅,就没继续,我怀疑它也不能直接利用已经认证的会话。

Android Chrome 长按链接,或者点击链接播放视频后再长按视频,就可以正常下载 mp4 视频,也不存在认证问题。桌面 Chrome 也一样,只是把长按换成右键单击。为什么在其他平台上如此简单的事情,在 iOS/iPadOS 上就搞得这么复杂? MacOS 我还没用过,不知道是什么行为,估计不会有问题吧。iOS/iPadOS Chrome 可以正常下载 mkv 文件,想必下载 mp4 文件也没有任何技术上的困难,为什么就不支持呢?目前主力的移动设备都是苹果,但是有时候遇到的限制真的很让人烦啊

Read More

Linux 6.15 Perf Tooling Introduces New Support For Latency Profiling

The perf tools changes were merged today for the Linux 6.15 kernel. Most notable this cycle for the wonderful perf tooling is introducing the notion of latency profiling by leveraging kernel scheduler information. This latency data will be further useful for Linux software engineers working to optimize system latency/performance.

The perf tools pull request for Linux 6.15 explains of this new "--latency" option for the "perf record" command:
"Introduce latency profiling using scheduler information. The latency profiling is to show impacts on wall-time rather than cpu-time. By tracking context switches, it can weight samples and find which part of the code contributed more to the execution latency.

The value (period) of the sample is weighted by dividing it by the number of parallel execution at the moment. The parallelism is tracked in perf report with sched-switch records. This will reduce the portion that are run in parallel and in turn increase the portion of serial executions.

For now, it's limited to profile processes, IOW system-wide profiling is not supported. You can add --latency option to enable this."

Dmitry Vyukov of Google worked on this latency reporting for perf as well as a new parallelism key. In the prior patch series he further elaborated on this latency profiling focus and purpose:
"There are two notions of time: wall-clock time and CPU time. For a single-threaded program, or a program running on a single-core machine, these notions are the same. However, for a multi-threaded/multi-process program running on a multi-core machine, these notions are significantly different. Each second of wall-clock time we have number-of-cores seconds of CPU time.

Currently perf only allows to profile CPU time. Perf (and all other existing profilers to the be best of my knowledge) does not allow to profile wall-clock time.

Optimizing CPU overhead is useful to improve 'throughput', while optimizing wall-clock overhead is useful to improve 'latency'. These profiles are complementary and are not interchangeable. Examples of where latency profile is needed:

- optimzing build latency
- optimizing server request latency
- optimizing ML training/inference latency
- optimizing running time of any command line program

CPU profile is useless for these use cases at best (if a user understands the difference), or misleading at worst (if a user tries to use a wrong profile for a job).
...
Brief outline of the implementation:
- add context switch collection during record
- calculate number of threads running on CPUs (parallelism level) during report
- divide each sample weight by the parallelism level
This effectively models that we were taking 1 sample per unit of wall-clock time.

We still default to the CPU profile, so it's up to users to learn about the second profiling mode and use it when appropriate."

The code is merged and ready to go with Linux 6.15. This new documentation goes into more detail on the CPU and latency overhead reporting for perf. Can't wait to see what improvements will be uncovered by Google and others leveraging perf record --latency.

Read More

Apple Watch Series 10 原型机亮相 配备独特健康传感器

@StellaFudge 今天分享了一张疑似 Apple Watch Series 10 原型机的照片,该原型机具有独特的健康传感器设计。与去年推出的 Apple Watch Series 10 实际型号相比,原型机上的健康传感器的 LED 阵列更小。

传感器周围还有一圈额外的灯,但目前尚不清楚它是做什么用的。据 @StellaFudge 称,该原型机运行的是 watchOS 11.1 的内部版本,该版本从未向公开发布。

GnY76RTXAAAsfWE.jpgGnY76RRXgAEm6vt.jpgGnY76RTXcAAKjIQ.jpg

由于专利纠纷,Apple Watch 背面的健康传感器仅用于测量佩戴者的心率和血氧。目前尚不清楚这款原型机上的传感器为何看起来不同,但这些变化可能与苹果测试 Apple Watch 未来的健康功能有关。

GnY76RqXsAA8K6K.jpg

例如,据报道,苹果一直在测试一项可以提醒您高血压迹象的功能。这项功能早在 Apple Watch Series 10 发布前几年就被传出,但苹果仍面临开发挑战。目前尚不清楚该功能是否会在 Apple Watch Series 11 发布前准备就绪。

image.png

Read More