欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
4 个有用工具
6 条新鲜资讯
1 个有趣 案例
3 个鲜明 观点
Hunt for Tools|先进工具
Stable Audio 2.0 正式发布
AI 独角兽 Stability AI 虽说一直处于风雨飘摇的状态,但产品的发布节奏却始终未曾停歇。
本周,Stability AI 宣布推出 Stable Audio 2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。
据介绍,Stable Audio 2.0 除了支持文本生成音频,还支持音频生成音频。 现在用户可以上传音频样本,并将这些样本扩展生成、补充相关的音频内容。 例如,你可以上传自己轻哼的一段旋律,在它的帮助下,或许会变成动听的音乐作品。
新模型还增强了从敲击键盘的声音到人群的喧哗声或城市街道的嗡嗡声等音效的制作。这一功能为提升音频项目和创造沉浸式体验提供了新的方式。
https://stability.ai/news/stable-audio-2-0
Haiper AI 会是 Sora 的最佳平替吗?
目前,Sora 向外界开放的日程尚未确定,在此期间,我们不妨可以尝试一下 Haiper AI 视频生成工具。
尽管 Haiper AI 制作的视频时长限制为 4 秒,但视频生成效果却能媲美 Pika、Runway 等一众老手。它支持多种视频风格,包括电影、水彩、赛博朋克、印象派、卡通动画等,满足不同用户的需求。
附上体验地址:https://app.haiper.ai/explore
此外,Haiper AI 还具备视频重绘功能,用户可以通过这一功能为已有视频添加新元素或改变其风格。同时,用户还可以轻松调整视频的色彩、纹理和其他视觉元素,以打造个性化的视频内容。
一起来欣赏网友的一些作品吧
https://twitter.com/HaiperGenAI
Sora 官方发布首支 MV
本周,OpenAI 官方频道在 YouTube 平台上推出了一支由 Sora 精心打造的 MV——《Worldweight》。
该视频的简介透露,这支两分多钟的 MV 是由艺术家 August Kamp 作曲,而 MV 的画面则是利用 Sora 来生成。
对于 August 来说,这部作品不仅仅是一支音画俱佳的 MV,更像是深植于他内心的情感和灵魂。
我仍记得两年前,那些音符是如何从我的指尖流淌,跃入合成器的键盘。当时外面正下着雨,我感到无比幸运,能够将所有的情感倾注到这首歌中。
https://www.youtube.com/watch?v=f75eoFyo9ns
OpenAI 为 DALL·E 3 添加图像编辑功能
近日,OpenAI 为旗下的「文生图」工具 DALL·E 3 引入了全新的的编辑功能。据悉,DALL·E 3 提供了两种主要的编辑方法,以满足用户不同的编辑需求。
首先是基于选择区域的编辑功能,在 DALL·E 3 生成图片后,用户可以轻松选中已生成图片中的特定区域,并在聊天界面中输入相应的提示词,要求 DALL·E 3 对该区域进行微调。
此外,DALL-E编辑器还提供了对话式编辑功能。用户只需在聊天窗口中直接描述自己的编辑内容,DALL·E 3 便能根据描述对整个图像进行相应的调整。
https://twitter.com/OpenAI/status/1775569161759985737
Hunt for News|先进头条
CB Insights 评出 2024 年AI 初创 100 强
近日,知名咨询分析公司 CB Insights 对全球最有前途的私营 AI 初创公司进行了年度排名。
本次排名重点关注来自 16 个国家/地区从事从大型语言模型到蛋白质设计等一系列 AI 应用的公司。
研究团队根据 CB Insights 数据(包括交易活动、行业合作伙伴关系、团队实力、投资者实力、专利活动和专有 Mosaic 分数)选出了 100 家 AI 初创公司。
从这张榜单中,你能看到什么熟悉的身影呢?
研究团队还分析了 CB Insights 对软件买家的采访,并深入研究了初创公司提交的分析师简报。
值得一提的是,中国仅有两家公司入围了该榜单,一家是李开复的零一万物,另外一家是深势科技(DP Technology)。
https://www.cbinsights.com/learn/ai-100-2024
数百名音乐家呼吁不要用 AI 取代人类艺术家
近日,超过 200 位知名音乐艺术家联名发起倡议,呼吁科技企业和数字平台停止利用 AI 侵犯艺术家权益。
这些音乐家包括 Billie Eilish、Katy Perry 和 Smokey Robinson 等,其中不乏格莱美奖得主,有的还捧回过奥斯卡小金人。
他们通过艺术家权利联盟(ARA)向相关方发出公开信,表达了对 AI 可能取代人类艺术创作的担忧。
ARA 执行董事 Jen Jacobsen 在接受采访时表示,他们并不寻求立法解决,而是希望技术与数字伙伴能与艺术家合作,共同维护音乐市场的健康发展和音乐质量,而非简单地取代人类艺术家。
公开信中明确提出,希望所有 AI 开发商、科技公司、平台和数字音乐服务商承诺不开发或使用可能损害或取代词曲作者和艺术家的 AI 音乐生成技术、内容或工具,确保艺术家的合法权益得到保护。
同时,信中也承认 AI 在促进人类创造力方面的积极作用,但指出目前一些平台和 AI 开发商的广泛应用已经对创造力造成了破坏,损害了艺术家、词曲作者、音乐家及相关权利人的利益。
https://artistrightsnow.medium.com/200-artists-urge-tech-platforms-stop-devaluing-music-559fb109bbac
OpenAI 放宽 ChatGPT 限制:免注册直接使用
当地时间 4 月 1 日,OpenAI 给我们送上了一份愚人节礼物,宣布 ChatGPT 将不再需要注册,就可以直接登录使用。
需要说明的是,不注册直接使用的版本是 GPT-3.5 ,GPT-4 仍然需要注册并付费使用。同时免注册版 ChatGPT 引入了更多内容保障措施,例如在更广泛的类别中屏蔽提示和生成。
当然,注册账号比起免注册版能获得的服务还是更多,包括保存和查看聊天记录、分享对话内容,还能解锁包括语音对话和自定义指令在内的其他功能。
不过,就目前开放的 GPT-3.5 的实际效果来说,国内像通义千问、智谱清言、百川智能的 Baichuan 3、还有最近很火的 kimi 在部分中文场景的表现或许会更出色。
https://twitter.com/OpenAI/status/1774848681981710821
Siri 要变聪明了?
近日,苹果最新研究论文介绍了他们在 AI 领域的新进展——新模型 ReALM,其可以理解屏幕上的任务、对话上下文和后台进程。
通过 ReALM 技术的应用,Siri 现在能够实时理解并识别用户屏幕上的内容,而无需依赖敏感的屏幕截图或图像数据,在提升智能之余,也充分保障了用户的隐私安全。
该模型不仅关注用户屏幕上显示的内容,还能够识别当前活跃的任务。论文结果显示,尽管该模型参数较少,但在某些方面的性能要远远优于 GPT-4。
以实际应用场景为例:当用户在浏览网页时,如果需要联系某个公司,只需简单地告诉 Siri「给这家企业打电话」,Siri 便能够识别并提取网页上的联系电话信息,并直接拨打过去。
关于 Siri 将会如何变得更聪明,欢迎点击回看 APPSO 以前的文章:
https://arxiv.org/pdf/2403.20329.pdf?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=apple-s-new-ai-model-outperforms-gpt-4
Sam Altman 联手 Jony Ive 打造的 AI 硬件不会像手机
据 The Information 报道,由前苹果首席设计师 Jony Ive 与 OpenAI 首席执行官 Sam Altman 共同创办的神秘公司,正计划推出一款 AI 硬件,并且已经开始与几位风险投资界的重量级人物进行融资谈判。
据知情人士透露,该初创公司已与 Emerson Collective 和 Thrive Capital 展开讨论,后者是 OpenAI 的一大投资者,其对话式人工智能技术有望成为该设备某些功能的核心。其中一位参与谈判的人士表示,Ive 希望筹集高达 10 亿美元的资金。
据讨论中的人士透露,即将开发的这款人工智能设备——预计不会与传统手机外观相似,而且这个合作也将增加 Altman 在 OpenAI 之外的诸多项目。
这些项目包括创建一家专门开发和制造用于支持人工智能的服务器芯片的公司,这可能与英伟达形成竞争。Altman 曾私下表示,OpenAI 很可能会持有该公司的部分股份,并成为其客户。
https://www.theinformation.com/articles/jony-ive-and-sam-altmans-ai-device-startup-in-funding-talks-with-emerson-thrive
OpenAI 偷爬 YouTube 视频训练 GPT-4
据《纽约时报》报道,OpenAI 使用 Whisper 音频转录模型转录了超过一百万小时的 YouTube 视频来训练 GPT-4。其中 OpenAI 总裁 Greg Brockman 亲自参与了收集视频的工作。
报道称 OpenAI 早在 2021 年就已经耗尽了有用数据,并在耗尽其他资源后讨论了转录 YouTube 视频、播客和有声读物的问题。
此外,OpenAI 还利用 GitHub 上的计算机代码、象棋移动数据库和 Quizlet 上的学校作业内容的数据训练了其模型。
对此,OpenAI 发言人 Lindsay Held 向 The Verge 透露,OpenAI 公司为每个模型策划了「独特」的数据集,以「帮助它们理解世界」并保持其全球研究竞争力。
据《纽约时报》消息人士透露,Google 发言人 Matt Bryant 表示,Google 根据与 YouTube 创作者的协议,也使用一些 YouTube 上的内容来训练模型。
https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&sgrp=c-cb
Hunt for Fun|先行
用笔记本跑大模型,你也可以
去年,微软开源了一个仅有 27 亿参数的小模型 Phi-2,但其在常识推理、语言理解和逻辑推理等方面的性能都有明显的改进,真正体现了「以小博大」。
如今,如果你想在笔记本电脑上跑大模型,那么小尺寸的 Phi-2 或许是不错的选择。
跑大模型的步骤如下:
1️⃣ 下载大模型训练平台 LM Studio
2️⃣ 在 LM Studio 中,搜索 Phi-2
3️⃣ 选择「TheBloke/phi-2-GGUF」并下载 Q6_K 或 Q4_K_S 版本
4️⃣ 打开「聊天」选项卡,确保选择 Phi-2,然后就可以开始和它聊天了
当然,虽然本地就能简单跑大模型,但对于电脑的配置还是有一定需求的,所以请量力而行。
https://lmstudio.ai/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=ai-talent-wars-openai-vs-tesla
Hunt for insights|先知
AI Pin 创始人:下一个计算时代将由 AI 驱动
近日,彭博社对 AI Pin 创始人之一 Bethany Bongiorno 进行了专访。
在谈论 AI Pin 的制作初衷时,Bongiorno 透露称,由于一家人曾在餐桌上各自使用手机而缺乏交流,引发了他们对智能手机给社会带来深远影响的思考。
同时,随着智能手机技术的不断进步和市场的日益饱和,Bongiorno 洞察到我们正处于一个转折点上,即将迎来一个新的时代。其坚信,下一个计算时代将由 AI 驱动。
面对外界对 AI Pin 的批评,Bongiorno 表示,「新鲜事物的出现以及人们对其潜力的不理解往往会阻碍人们立即对其进行欣赏。这种情况经常发生。我们确实也看到了即使在非消费电子产品上也会出现这种现象——例如特斯拉。」
对于 Sam Altman 联手 Jony Ive 打造新 AI 硬件的行为, Bongiorno 称不太清楚新 AI 硬件的具体细节,同时其表示对 AI 带来的变革潜力充满信心,并相信这一技术将深刻影响各个领域。
https://www.bloomberg.com/news/newsletters/2024-04-04/humane-s-founders-are-ready-to-win-over-skeptics-of-their-699-ai-pin
OpenAI 高管:2024 年是 AI 的「应用之年」
据彭博社报道,OpenAI 首席运营官 Brad Lightcap 近日在接受采访时表示,目前已有 60 万人注册使用 ChatGPT Enterprise,而 1 月份的人数约为 15 万人。
Lightcap 在采访中预测,2024 年将是 AI 的「应用之年」,目前已经看到了这种巨大的增长趋势。
值得一提的是,作为首席运营官,Lightcap 的任务正是为 OpenAI 建立新的收入来源,并证明生成式 AI 可以获得巨大的营收。
当被问及 OpenAI 首席执行官 Sam Altman 筹集数十亿资金建立芯片工厂的计划时,Lightcap 表示:「我们认为,未来十年供应链将需要适应这种高度变化且几乎呈指数级增长的需求。」
https://www.bloomberg.com/news/articles/2024-04-04/openai-sees-tremendous-growth-in-corporate-version-of-chatgpt
马斯克:AI 或在 2030 年超越人类智力
近日,特斯拉 CEO 埃隆·马斯克在 Abundance 360 峰会上与彼得·迪亚曼迪斯进行了一场线上对话。
马斯克认为,按照目前的发展速度,AI 或将在 2023 年超越人类智力,并且这项技术很有可能将终结人类。
「AI 被称为奇点是有原因的,当超级智能出现时,很难预测接下来会发生什么——它有可能会终结人类。」马斯克同意 AI 教父杰弗里·辛顿的看法,认为此类事件发生的概率为 10% 到 20%。
马斯克还表示,就 AI 的安全性而言,至关重要的是要让其具有极大的探索真理和好奇心。
他进一步指出,实现 AI 的最高安全水平的关键在于,即使面对令人不快的真相,也绝不迫使 AI 说谎。
https://observer.com/2024/03/elon-musk-discuss-artificial-general-intelligence/
彩蛋时间
《水无形而有万形》
向左滑动查看更多内容
作者:@umesh_ai
工具:DALL·E 3
Prompt:Photorealistic image of a water sculpture in the shape of a [主题], crafted from spiraling, ocean-blue water currents that mimic the [主题] form with astonishing realism. Each swirl and vortex within the sculpture adds to the lifelike depiction of the [主题], suggesting movement and fluidity. A person is holding this mesmerizing water [主题], their expression one of fascination and wonder. The backdrop is deliberately simple, ensuring that the focus remains on the intricate details and dynamic water effects that bring this aquatic [主题] to life.
链接:https://twitter.com/umesh\_ai/status/1775840470012416167
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.