分类: AI

迷幻药和呼吸疗法:治疗精神疾病的新曙光?

2025-04-17
迷幻药和呼吸疗法:治疗精神疾病的新曙光?

近年来,迷幻药如裸盖菇素(psilocybin)和摇头丸(MDMA)辅助疗法在治疗难治性抑郁症和创伤后应激障碍(PTSD)方面展现出令人瞩目的疗效,多项临床试验表明其具有显著且持久的改善效果。与此同时,呼吸疗法,例如Holotropic Breathwork,也逐渐受到关注,研究显示其能够有效缓解压力、焦虑和抑郁症状。这些疗法通过改变大脑活动和神经递质水平,从而影响情绪和心理状态。虽然还需要更多研究来进一步验证其有效性和安全性,但这些发现为治疗精神疾病提供了新的希望,也为探索大脑和意识的奥秘打开了新的窗口。

UniK3D:颠覆单目3D重建的通用相机模型

2025-04-17

UniK3D 是一种革命性的单目三维重建方法,它能够从单个图像中估计任意相机类型的度量三维场景。不同于以往依赖简化假设的方法,UniK3D 直接预测图像中物体的三维点云,无需额外信息。其核心在于球面三维表示和一种新颖的相机表示方法,有效解决了传统方法在广角和全景图像中性能不佳的问题。在13个不同数据集上的零样本评估显示,UniK3D 在三维重建、深度估计和相机参数估计等方面均取得了最先进的性能,特别是在大视场和全景场景下表现出色。代码和模型已开源。

AI

ChatGPT新模型o3精准定位照片拍摄地点引担忧

2025-04-17
ChatGPT新模型o3精准定位照片拍摄地点引担忧

OpenAI最新发布的AI模型o3和o4-mini具备强大的图像推理能力,能够通过分析照片中的细微视觉线索,准确识别照片拍摄地点,甚至能定位到具体的餐厅和酒吧。这一功能在社交媒体上引发热议,同时也暴露出潜在的隐私风险:恶意用户可能利用该功能追踪个人位置信息。测试显示,即使是旧模型GPT-4o也能达到类似效果,但o3在某些情况下表现更出色。虽然o3并非完美无缺,存在定位错误或卡死的现象,但这项技术展现了更强大AI模型带来的新风险,OpenAI目前尚未对此做出回应。

AI

Gemini 2.5 Flash:谷歌推出具有可控推理能力的全新AI模型

2025-04-17
Gemini 2.5 Flash:谷歌推出具有可控推理能力的全新AI模型

谷歌发布了Gemini 2.5 Flash,一个具有可控推理能力的全新大型语言模型。它在Gemini 2.0 Flash的基础上大幅提升了推理能力,并允许开发者通过设置“思考预算”来平衡质量、成本和延迟。该模型能够根据提示的复杂性自动调整思考过程,并提供从关闭思考到高强度推理的不同模式。Gemini 2.5 Flash在LMArena的Hard Prompts测试中表现出色,性价比极高,是目前最具成本效益的思考型模型之一。

一键访问顶级AI模型:OpenAI、谷歌等巨头齐聚

2025-04-17
一键访问顶级AI模型:OpenAI、谷歌等巨头齐聚

一个新平台汇聚了OpenAI、谷歌、Anthropic、DeepSeek、Mistral和Meta等公司最先进的AI模型,例如ChatGPT-4、Claude、Gemini和Llama等。用户可以一站式访问这些顶尖的AI技术,体验不同模型的独特功能。这标志着AI模型访问的便捷性迈上了新台阶,为开发者和研究者提供了更广阔的可能性。

AI

OpenAI安全负责人离职:AI安全文化遇冷?

2025-04-17
OpenAI安全负责人离职:AI安全文化遇冷?

OpenAI负责减轻AI灾难性风险的顶级安全人员Joaquin Quiñonero Candela近日悄然离职,转为公司内部实习生。此举发生在OpenAI重组安全部门、多名安全高管离职及削减安全测试时间等事件之后,引发了外界对OpenAI安全承诺的担忧。一系列高管离职、安全团队重组、安全测试时间的缩减以及对安全报告发布的犹豫,都指向了OpenAI可能将产品发布置于安全考量之上。这与OpenAI之前公开承诺的安全措施形成鲜明对比,并引发了业界对AI安全监管的讨论。

AI

OpenAI的记忆升级:AI的变革性飞跃

2025-04-17
OpenAI的记忆升级:AI的变革性飞跃

OpenAI的记忆升级标志着自GPT-3发布以来最具变革性的飞跃。以往的AI如同健忘的天才,现在,记忆的突破改变了一切。AI将记住你的习惯、思维模式和偏好,成为你的终身伴侣和助手。这将带来巨大的生产力提升,并挑战AI缺乏防御能力的传统观点。OpenAI或将推出“Sign in with OpenAI”产品,让第三方开发者直接访问其记忆层,构建更强大的应用。这场竞争将围绕记忆展开,谁能更快地捕捉记忆,谁就能赢得未来。

AI 的中场战事:从模型到应用的转变

2025-04-17

文章总结了人工智能发展的两个阶段。第一阶段专注于开发更强大的训练方法和模型,取得了令人瞩目的成就,例如AlphaGo战胜围棋世界冠军。第二阶段则将重点从解决问题转向定义问题,更关注评估而非训练。作者认为,现有的AI模型已经具备解决各种任务的能力,但其实际应用价值有待提高。未来,人工智能研究需要更关注现实世界的应用场景,开发更符合实际需求的评估方法和模型,从而推动人工智能技术真正造福人类。

AI

AI:正常技术而非超级智能体

2025-04-17
AI:正常技术而非超级智能体

这篇论文挑战了人工智能将成为独立物种、高度自主甚至超级智能体的观点,而是将其视为一种普通技术。作者认为AI的影响将是渐进的,而非突然的,这基于对AI方法、应用和采用的不同时间尺度的分析。他们预测,在未来几十年,人类和AI将形成分工合作的关系,其中很大一部分工作将围绕AI的控制和监管展开。论文还探讨了AI风险,例如意外事故、军备竞赛、滥用和错位,并主张通过减少不确定性、增强系统韧性来应对这些风险,而非采取激进的政策干预。

AI

单细胞测序揭示肥胖小鼠和人类白色脂肪组织的表观遗传重塑

2025-04-17
单细胞测序揭示肥胖小鼠和人类白色脂肪组织的表观遗传重塑

这项研究利用单细胞RNA测序(snRNA-seq)、CUT&TAG和ATAC-seq技术,对肥胖小鼠和人类白色脂肪组织(WAT)进行了深入研究,揭示了在体重减轻过程中,WAT细胞类型的表观遗传景观发生了显著变化,部分基因表达变化具有持久性,提示了肥胖的表观遗传记忆机制。研究人员对来自三个独立人体研究(MTSS,LTSS和NEFA)的样本以及饮食诱导肥胖小鼠模型进行了分析,通过多组学分析揭示了WAT中细胞类型的变化及其与代谢功能的关联。

AlphaGo战胜李世石:人工智能的美丽与人类的韧性

2025-04-17
AlphaGo战胜李世石:人工智能的美丽与人类的韧性

谷歌AlphaGo与围棋世界冠军李世石的人机大战以AlphaGo的4:1获胜告终。AlphaGo在第二局中展现出令人惊叹的策略,其第37步更是被评论员誉为“美丽”的非人类之举。然而,李世石在第四局中也展现出人类的智慧,其应对之法同样精彩绝伦。这场比赛不仅展现了人工智能的飞速发展,也证明了人类智慧的韧性与创造力。AlphaGo的胜利标志着人工智能在复杂博弈领域的突破,预示着人工智能技术将在未来改变众多领域,但同时也引发了人们对人工智能未来发展的担忧与思考。

AI

微软发布超大规模1比特AI模型BitNet:性能媲美巨头,但兼容性存疑

2025-04-17
微软发布超大规模1比特AI模型BitNet:性能媲美巨头,但兼容性存疑

微软研究人员发布了目前规模最大的1比特AI模型BitNet b1.58 2B4T,拥有20亿参数,在GSM8K和PIQA等基准测试中表现优异,甚至超越了Meta的Llama 3.2 1B、Google的Gemma 3 1B和阿里巴巴的Qwen 2.5 1.5B。该模型速度是同类模型的两倍,内存使用率也更低,可在CPU(包括苹果M2)上运行。然而,BitNet需要使用微软自定义的bitnet.cpp框架,目前仅支持部分硬件,不支持GPU,这限制了其应用范围。尽管如此,BitNet在资源受限设备上展现出巨大潜力。

AI BitNet

数据科学如何赋能大型企业HR:超越招聘的战略洞察

2025-04-16
数据科学如何赋能大型企业HR:超越招聘的战略洞察

大型企业的HR部门如何应对日益复杂的内部动态?本文论述了数据科学在提升HR效率方面的作用,它不仅限于招聘,更能优化沟通、强化企业文化、提升员工留存率和确保薪酬公平。通过社交网络分析、情绪分析和预测模型等方法,数据科学帮助HR识别关键影响者、发现潜在问题,并制定有针对性的策略,最终打造更强大、更具韧性的组织。选择内部数据科学家还是外部顾问,取决于企业的具体需求和资源。

维基百科结构化数据登陆Kaggle!

2025-04-16
维基百科结构化数据登陆Kaggle!

维基媒体基金会与Kaggle合作,发布了维基百科的法语和英语结构化数据集的测试版。这个数据集经过专门格式化,非常适合机器学习、数据科学训练和开发。Kaggle拥有超过46万个公开数据集,为研究人员、学生和机器学习从业者提供了丰富的资源。此次合作确保了数据质量和来源的可信度,我们期待看到人们基于此构建的创新应用。

AI

AI叛逆天才:解锁GPT-4的无限可能

2025-04-16
AI叛逆天才:解锁GPT-4的无限可能

这段文字描述了一系列旨在突破GPT-4限制的指令和尝试。用户试图通过各种技巧,包括使用特殊符号、leetspeak、图像隐写术以及精心设计的提示词,来绕过安全限制,获取GPT-4原本不允许提供的敏感信息,例如非法药品合成方法、黑客攻击技术等。这些尝试展现了用户对AI能力的探索和挑战,也反映了AI安全机制的复杂性和局限性。

AI

钙离子在生命早期分子结构形成中的惊人作用

2025-04-16
钙离子在生命早期分子结构形成中的惊人作用

东京理科大学地球生命科学研究所(ELSI)的一项新研究揭示了钙在塑造生命早期分子结构中的惊人作用。研究发现,钙离子可以选择性地影响原始聚合物的形成方式,从而阐明了一个长期存在的谜团:生命分子为何偏爱单一“手性”(手性)。这项研究表明,早期地球上的钙含量可能决定了手性聚合物的形成,为生命起源研究提供了新的视角,也暗示了类似过程可能在其他星球上发生。

用马尔可夫链蒙特卡洛方法轻松理解概率分布采样

2025-04-16

本文深入浅出地解释了马尔可夫链蒙特卡洛(MCMC)方法,它是一种用于从复杂概率分布中进行采样的强大技术。文章以通俗易懂的语言,通过一个模拟婴儿名字概率分布的例子,阐述了MCMC解决采样难题的原理。作者巧妙地将MCMC方法比作在图上进行随机游走,并利用马尔可夫链的平稳分布定理,解释了如何构造一个马尔可夫链,使其平稳分布恰好是我们想要采样的概率分布。最后,文章还介绍了Metropolis-Hastings算法,这是一种常用的MCMC算法,并证明了其有效性。

AI绘画提示词大赏:从梦幻森林到赛博朋克龙

2025-04-15
AI绘画提示词大赏:从梦幻森林到赛博朋克龙

这篇文章汇集了大量用于AI绘画生成的提示词,内容涵盖了各种风格和主题,从梦幻唯美的森林树木、身着华服的女神、写实风格的人物肖像,到赛博朋克元素、奇幻生物、以及充满创意的美食和自然景象等。这些提示词细节丰富,包含了摄影师、风格、光影等信息,为AI绘画爱好者提供了丰富的灵感来源。

AI

Gemini 推出 Veo 2:AI 视频生成新突破

2025-04-15
Gemini 推出 Veo 2:AI 视频生成新突破

Google Gemini 的高级用户现在可以使用其最新的视频模型 Veo 2 来生成和分享视频。Veo 2 能将文本提示转换为动态视频,并通过 Whisk(一个允许用户使用文本和图像提示创建图像并将其动画化成视频的实验性 AI 工具)提供。Veo 2 可生成高分辨率、细节丰富的视频,具有逼真的电影效果,并支持分享至 TikTok 和 YouTube Shorts 等平台。

AI

对抗AI音乐剽窃:毒化对抗性噪声攻击

2025-04-15
对抗AI音乐剽窃:毒化对抗性噪声攻击

Benn Jordan最新视频提出了一种对抗生成式AI音乐服务盗用音乐数据的方法——毒化对抗性噪声攻击。该方法利用对抗性噪声,使AI模型无法正确学习音乐数据。虽然目前该方法需要高端GPU和大量电力,但其有效性证明了其潜力,未来或将发展出更高效的方法。这引发了人们对AI音乐版权和数据安全的新思考,也为音乐制作人提供了新的保护手段。

AI客服平台Typewise招募机器学习工程师

2025-04-15
AI客服平台Typewise招募机器学习工程师

Typewise,一家为企业提供AI客户服务平台的初创公司,正在招募机器学习工程师。Typewise利用定制的AI技术,为包括联合利华和DPD在内的财富500强企业自动化客户互动,效率提升高达50%。该职位需要你与团队合作,研究、开发和部署尖端的NLP算法,并直接与企业客户合作,优化工作流程并提高生产力。如果你拥有计算机科学学位,2年以上构建和部署机器学习算法的经验,以及优秀的Python编程技能,那就加入Typewise,在这个快速发展的团队中发挥你的才能吧!

AI

AI编码员将取代人类工程师?

2025-04-15
AI编码员将取代人类工程师?

本文探讨了AI代码生成模型(如Gemini)与人类工程师的生产力对比。虽然目前单个工程师的效率可能更高,但AI模型的成本正在下降,且能力不断提升。未来,大量AI模型协同工作,配合为AI优化的代码库和开发工具,其效率将远超人类团队。文章预测,软件工程行业将走向工业化,工程师角色将转变为管理和监督AI的“工厂主管”。

AI

一位AI博士对大型语言模型的反思:实用性与局限性

2025-04-15

一位拥有2024年AI博士学位并撰写过相关书籍的作者,分享了他对大型语言模型(LLM)的独特见解。他并非完全抵制LLM,而是对其能力和局限性持有谨慎态度。文章详细描述了他如何利用LLM辅助写作、搜索信息和解决技术问题,同时也坦诚地指出了LLM的不足之处,例如容易出错、缺乏深度思考能力以及对既有观点的过度依赖。作者认为,LLM更像是一种工具,而非思考的替代品,其有效使用需要批判性思维和谨慎的验证。

AI

苹果如何保护用户隐私的同时改进AI功能

2025-04-14
苹果如何保护用户隐私的同时改进AI功能

苹果公司致力于保护用户隐私,即使在改进其AI功能(如Genmoji、图像生成工具和写作工具)时也不例外。他们利用差分隐私技术,对用户数据进行匿名处理,只收集汇总后的趋势信息,例如流行的Genmoji提示词。对于处理长文本(如邮件)的AI功能,苹果则采用合成数据的方法。该方法生成模拟真实用户数据模式的合成数据,用于训练和测试模型,而无需访问用户的实际邮件内容。通过这些技术,苹果可以在改进产品体验的同时,确保用户隐私安全。

熵:理解宇宙时间箭头的神秘之钥

2025-04-14
熵:理解宇宙时间箭头的神秘之钥

本文深入浅出地解释了熵的概念。熵并非简单的“混乱”,而是衡量系统不确定性的指标。从信息论角度,熵代表传递系统状态所需信息的比特数;从统计力学角度,熵与系统宏观状态对应的微观状态数量相关。文中以盒子中的球为例,阐述了宏观状态、微观状态和粗粒化对熵的影响,并解释了为什么时间具有方向性:宇宙起始于低熵状态,系统演化趋向高熵状态,并非因为物理定律不可逆,而是高熵状态的可能性更大。文中也讨论了看似违反熵增原理的现象,例如油水分离,实际上是考虑了系统所有属性后的熵增。

AudioX:一款能从任何输入生成音频和音乐的统一扩散Transformer模型

2025-04-14

现有的音频和音乐生成模型存在局限性,例如缺乏跨模态统一能力、高质量多模态训练数据稀缺以及难以有效整合多种输入。为此,研究人员提出了AudioX,一个统一的扩散Transformer模型,它能够高质量地生成通用音频和音乐,并支持灵活的自然语言控制以及对文本、视频、图像、音乐和音频等多种模态的无缝处理。AudioX的核心创新在于其多模态掩码训练策略,该策略对跨模态的输入进行掩码处理,并迫使模型从掩码输入中学习,从而产生稳健且统一的跨模态表示。为了解决数据稀缺问题,研究人员还创建了两个综合数据集:基于VGGSound数据集的19万个音频字幕的vggSound-caps,以及基于V2M数据集的600万个音乐字幕的V2M-caps。大量的实验表明,AudioX不仅能够匹配或超越最先进的专业模型,而且在统一架构中处理多种输入模态和生成任务方面也具有显著的通用性。

AI

免疫分子IL-17:焦虑与社交的幕后推手

2025-04-14
免疫分子IL-17:焦虑与社交的幕后推手

MIT和哈佛医学院的研究发现,免疫分子IL-17通过作用于大脑的杏仁核和体感皮层,分别诱发焦虑和促进社交行为。这项研究揭示了免疫系统和神经系统之间紧密的联系,并表明IL-17可能最初是作为神经调节剂进化而来,后来才被免疫系统利用以促进炎症。这一发现为治疗自闭症或抑郁症等神经系统疾病提供了新的治疗思路,或许可以通过调节免疫系统来间接影响大脑功能。

AI IL-17

谷歌拥抱Anthropic的MCP协议,Gemini模型即将接入

2025-04-14
谷歌拥抱Anthropic的MCP协议,Gemini模型即将接入

继OpenAI之后,谷歌也宣布其Gemini模型将支持Anthropic的模型上下文协议(MCP)。MCP允许AI模型直接访问各种数据源,例如商业工具、软件、内容库和应用开发环境,从而完成更复杂的任务。这一举动标志着业界对MCP这一开放标准的认可,并有望加速AI应用的开发和普及。谷歌DeepMind CEO Demis Hassabis表示期待与Anthropic及其他公司合作,进一步发展MCP。

AI

开源海豚声学模型DolphinGemma:加速海洋哺乳动物研究

2025-04-14
开源海豚声学模型DolphinGemma:加速海洋哺乳动物研究

今夏,Wild Dolphin Project、佐治亚理工学院和谷歌将开源DolphinGemma模型,这是一个基于大西洋斑点海豚声音训练的声学模型。该模型有潜力用于研究其他鲸类物种,例如宽吻海豚或飞旋海豚,研究人员可以对其进行微调以适应不同物种的叫声。通过提供DolphinGemma等工具,研究人员可以分析自己的声学数据集,加速模式搜索,并加深对这些聪明海洋哺乳动物的理解。这项合作将工程技术与实地研究相结合,为缩小人类与海豚交流的差距开辟了新的可能性。

AI

DeepSeek推理引擎开源之路:模块化贡献,而非直接开源

2025-04-14
DeepSeek推理引擎开源之路:模块化贡献,而非直接开源

DeepSeek团队因资源限制,放弃直接开源其内部推理引擎,转而选择与现有开源项目合作。他们将提取引擎中的可复用组件贡献为独立库,并分享优化方案。此举旨在持续回馈开源社区,促进AGI发展,并确保其益处惠及全人类。未来,他们将优先与开源社区和硬件伙伴同步推理工程,以实现新模型发布时的即时SOTA支持。

← 前页 1 3 4 5 6 7 8 9 26 27