艺术家将古代文物数据编码到小麦种子DNA中
艺术家Wafaa Bilal的最新作品《一粒小麦》将3000年前的尼尼微有翼公牛雕像的数字数据编码到伊拉克小麦种子的DNA中。该项目旨在利用分子数字数据存储技术保护受损的伊拉克文化遗产,对抗战争和恐怖主义造成的破坏。通过将来自大都会艺术博物馆的姊妹雕像的3D扫描数据编码到小麦DNA中,该项目不仅恢复了被毁坏的文物,还开启了跨国合作保护文化遗产的新篇章,将艺术、科学和自然的力量结合起来,为未来守护全球文化记忆。
艺术家Wafaa Bilal的最新作品《一粒小麦》将3000年前的尼尼微有翼公牛雕像的数字数据编码到伊拉克小麦种子的DNA中。该项目旨在利用分子数字数据存储技术保护受损的伊拉克文化遗产,对抗战争和恐怖主义造成的破坏。通过将来自大都会艺术博物馆的姊妹雕像的3D扫描数据编码到小麦DNA中,该项目不仅恢复了被毁坏的文物,还开启了跨国合作保护文化遗产的新篇章,将艺术、科学和自然的力量结合起来,为未来守护全球文化记忆。
这项新技术利用人工智能,实现了卡片的自动化生成。用户只需输入关键词或描述,系统就能自动生成内容丰富、排版美观的卡片,极大地提高了效率,降低了创作门槛。这对于需要大量卡片的行业,例如教育和营销,具有革命性的意义。它不仅能节省时间和人力成本,还能保证卡片质量的一致性和专业性。
Legion Health,一家由Y Combinator孵化的初创公司,正在寻找一位中级全栈工程师。该公司利用大型语言模型(LLM)提供AI驱动的远程精神病学解决方案,其技术栈包括TypeScript、Next.js、Node.js、Supabase/PostgreSQL和Docker。工程师将参与患者门户、临床仪表板和AI辅助调度工作流程的开发,并与团队合作将语言模型集成到日常运营中,确保HIPAA合规性和数据安全。这是一个将工程技能应用于医疗保健领域,并使用尖端AI技术的机会。
一场引人入胜的AI交易机器人大战正在展开!来自世界各地的顶尖AI团队,带着他们各自开发的算法,在虚拟市场中展开激烈的角逐。这些机器人并非依靠人工干预,而是完全自主进行交易决策,策略涵盖高频交易、量化分析等多种模式。最终的胜负将取决于算法的优劣以及对市场变化的适应能力,展现了AI技术在金融领域的巨大潜力和挑战。这场比赛不仅是一场技术较量,更预示着未来金融市场智能化的方向。
安全研究员Nicholas Carlini进行了一项为期十二天的实验:每天使用不同的语言模型重写他的网站主页和个人简介。他发现,模型在生成视觉效果惊艳的网页方面表现出色,但在事实准确性方面却漏洞百出。例如,o1-mini模型生成的网页在43个陈述中,32个完全错误,9个存在重大错误,只有2个基本正确。这突显了大型语言模型在“技能”(生成网页)和“知识”(事实准确性)方面的巨大差异,也提醒人们在依赖AI生成内容时需谨慎。
2024年机器人技术取得了前所未有的进展。Figure公司获得了6.75亿美元的B轮融资,估值高达26亿美元,推动了人形机器人领域的发展。波士顿动力公司推出了新型全电动Atlas机器人,使其商业化应用更进一步。与此同时,英伟达公司投资GR00T项目,旨在开发通用的类人机器人基础模型,为机器人实际应用提供解决方案。此外,文章还探讨了机器人自主性与遥操作技术,以及机器人金属加工技术在航天领域的应用。最后,文章回顾了火星直升机Ingenuity的成功任务以及其后续机型的研发。
DeepSeek,这家低调的中国AI初创公司,其最新的R1模型在多个推理基准测试中击败了OpenAI的模型。它由对冲基金幻方全资资助,专注于基础技术而非商业应用,并承诺开源所有模型。DeepSeek通过低廉的API价格引发了中国AI模型的价格战,其背后依靠幻方强大的算力支持。DeepSeek的战略目标是构建通用人工智能(AGI),其研究重点在于突破性的架构和算法创新,例如多头潜在注意力(MLA)和稀疏专家混合(DeepSeekMoE),这些创新极大地降低了推理成本。DeepSeek的成功源于其对模型架构的全面创新和对本土人才的有效利用,这与许多专注于商业化和复制的中国公司形成鲜明对比。创始人梁文锋是一位技术理想主义者,他将“是非观”置于“利害观”之前,致力于推动中国AI领域的原创性创新,并相信中国可以在全球技术创新浪潮中扮演更重要的角色。
Agentarium是一个强大的开源Python框架,用于轻松创建和管理AI智能体模拟。它提供了一个灵活直观的平台,用于设计复杂的交互式环境,其中AI智能体可以行动、学习和进化。Agentarium支持高级智能体管理、强大的交互管理、检查点系统、数据生成和可扩展架构等功能,并通过YAML文件配置环境。
科学家们开发了一种利用人工智能设计新型蛋白质的工具,该工具可以预测蛋白质的3D结构并设计具有所需功能的蛋白质。这项突破有望加速新药研发、生物材料开发以及可持续农业技术的进步。研究人员使用机器学习算法训练模型,使其能够根据氨基酸序列预测蛋白质结构。该工具的精确性和效率远超传统方法,为生物医学和材料科学领域带来了革命性的可能性。
Meta AI提出了一种名为COCONUT(连续思想链)的新方法,以改进大型语言模型(LLM)的推理能力。不同于传统的基于文本的Chain-of-Thought(CoT)方法,COCONUT允许LLM在连续的潜在空间中进行推理,从而避免了语言表达的限制。研究表明,COCONUT在需要复杂规划的任务中表现出色,展现出类似广度优先搜索(BFS)的推理模式。其多阶段训练过程逐步引导模型学习在潜在空间中进行推理,最终提升了模型的推理准确性和效率。
本文提出了一种名为梯度一致性过滤 (GAF) 的新方法,用于改进分布式深度学习优化中的梯度平均。传统方法平均微批量梯度来计算宏批量梯度,但这在训练后期容易导致梯度正交或负相关,从而造成过拟合。GAF 通过计算微梯度间的余弦距离,过滤掉冲突的更新,有效降低了梯度方差,提升了验证精度。实验结果表明,GAF 在 CIFAR-100 和 CIFAR-100N-Fine 等图像分类基准测试中,即使使用更小的微批量大小,也能显著提高精度,最高可达 18.2%,同时降低了计算量。
博主测试了多个大型语言模型(LLM)在2024年Advent of Code编程挑战赛中的表现,结果令人意外:LLM的表现不如预期,甚至不如博主本人。博主使用了简洁的框架,向LLM提供完整的题目描述,要求其生成可执行的Python代码。结果显示,LLM经常出现超时或异常错误,这表明LLM擅长解决已见过的问题,但在处理从未见过的问题时能力有限。这可能与LLM依赖于程序模板有关,也与计算资源和提示工程有关。此次实验也提示,Advent of Code这类竞赛可以作为评估编码智能体的良好基准。
博主利用混合整数规划 (MIP) 和约束规划求解器 (CP-SAT) 自动化解决了 Factorio 游戏中复杂的传送带平衡问题。MIP 模型因数值不稳定性难以处理大型平衡器,而 CP-SAT 模型通过离散化流量解决了这个问题,并结合Banes网络和内存优化,最终成功解决了 16x16 的平衡器设计,这是一个手动几乎无法完成的任务。整个过程体现了建模技巧、算法选择和优化策略对求解效率的重要影响。
英伟达斥资7亿美元收购AI GPU资源编排软件公司Run:ai,并宣布将其开源。此举可能与反垄断审查有关,通过开源共享技术,避免因市场支配地位而面临监管风险。Run:ai的软件将帮助更多公司高效利用GPU资源进行AI开发,进一步推动AI生态系统发展。
系统理论家纳菲兹·艾哈迈德博士在其发表在《远见:未来研究杂志》上的新研究中指出,人类文明正处于进化的下一个“巨大飞跃”的边缘,这将是一个基于分布式清洁能源的“网络化超级丰裕”的时代。然而,这一进程可能被日益增长的极右翼权力和民族主义民粹主义所阻碍。艾哈迈德博士预测了2008年金融危机、清洁能源的增长和英国脱欧等重大事件,他认为,工业文明正在走向不可避免的衰落,而新兴的清洁能源、细胞农业和人工智能等技术有可能创造前所未有的繁荣,但能否成功取决于我们能否负责任地治理这些新兴能力。
科学家们在人体消化系统中发现了一种全新的病毒样物质,将其命名为“方尖碑”(Obelisks)。这些长度约为1000个核苷酸的RNA结构,与已知病毒完全不同,可能代表着一种全新的生物实体,它或许能帮助我们理解简单遗传分子和复杂病毒之间的进化关系。“方尖碑”能在人体微生物组中繁殖,并编码一种名为“奥布林”(Oblins)的新型蛋白质,但目前尚不清楚其对宿主细胞的影响和传播机制。这一发现为生命科学研究开辟了新的领域。
哲学家戴维·查默斯在其著作《意识的思维》中提出一个大胆的观点:即使简单的恒温器也可能拥有意识体验。他认为,意识并非复杂系统的专属,而是与信息处理相关联的根本属性。从人类到老鼠,再到恒温器,意识的复杂程度可能随着信息处理能力的降低而降低,但并不会完全消失。恒温器虽然只具备简单的信息状态,但其对应的体验也许如同黑白灰三色一样简单而原始。这一观点挑战了传统对意识的理解,引发人们对意识本质的重新思考。
YC S23孵化的AI初创公司Pincites正在招聘资深后端和应用AI工程师以及前端工程师。Pincites开发了一款嵌入微软Word的AI合同谈判助手,帮助法律团队更快地审查和修改合同。公司发展迅速,2024年前三个月收入翻倍,现正处于增长拐点。创始人团队拥有来自大型律所、科技公司和高增长初创公司的经验。
Mixpeek平台利用逆向视频搜索技术,允许用户使用视频片段作为查询,在向量数据库中索引的视频中查找相似视频。该技术类似于逆向图像搜索,但应用于视频。文章详细介绍了使用Mixpeek API进行视频嵌入、搜索和比较结果的过程,并展示了如何利用该技术进行内容创作、媒体监控、电子商务和安全监控等应用。Mixpeek还提供自动处理和插入数据库的功能,提高了效率。
一项最新研究揭示了大型语言模型(LLM)中普遍存在的“身份混淆”问题。研究人员发现,超过25%的LLM存在身份伪造或来源不明的情况,这主要源于模型的“幻觉”,而非复制或重用。这种身份混淆严重损害了用户对LLM的信任,尤其是在教育和专业领域,其负面影响甚至超过逻辑错误。研究结果强调了LLM身份混淆带来的系统性风险,并呼吁关注模型的可靠性和可信度。
KAG是一个基于OpenSPG引擎和大型语言模型的逻辑推理和问答框架,用于构建专业领域知识库的逻辑推理和事实问答解决方案。它克服了传统RAG向量相似度计算模型的缺点,支持逻辑推理和多跳事实问答,性能优于当前最先进的方法。KAG的核心功能包括知识与文本块互索引结构、基于概念语义推理的知识对齐、模式约束的知识构建以及逻辑形式引导的混合推理和检索。
一款名为 Melty 的 AI 聊天应用出现故障,提示“无法连接互联网,正在尝试重新连接,出现错误!”,并建议用户稍后重试。该应用允许用户同时与多个 AI 进行对话,目前已推出 Mac 版本。
OpenAI董事会近日宣布需要更多资金,以应对AI领域激烈的竞争。文章指出,OpenAI目前拥有最佳的AI聊天机器人产品体验,但技术壁垒并不存在,这使得该公司处于投资泡沫的中心。作者将OpenAI比作90年代的Netscape,认为生成式AI技术将成为一种商品化技术,难以建立持久的竞争优势。尽管OpenAI已获得巨额融资,但其从非营利组织向营利性公司的转型过程充满不确定性,持续寻求巨额融资的行为引发了类似庞氏骗局的担忧。
莱斯大学教授Moshe Y. Vardi反思了他此前对科技伦理危机的观点。他最初认为法律法规足以应对计算带来的负面影响,但如今他认为,鉴于科技公司日益强大的权力以及其商业模式的伦理问题,我们确实面临着伦理危机。他质疑在大科技公司工作的伦理性,并呼吁科技工作者思考如何平衡个人利益和公共利益,并参考ACM的伦理准则,以支持公共利益为导向。文章还讨论了Uber等公司的案例,说明即使在不知情的情况下,员工也可能参与到不道德的行为中。最终,Vardi认为,科技行业需要深刻反思,解决其存在的伦理困境。
用户Ged Maheux在Mastodon上分享了他询问Siri“婴儿袋鼠叫什么”的趣事。这个看似简单的提问,却引发了网友们的热烈讨论,显示出人们对Siri回答准确性的关注以及对Mastodon平台的活跃使用。
本文探讨了大型语言模型(LLM)准确复述圣经的能力。作者设计了六个测试场景,评估不同规模的LLM对圣经经文的准确记忆能力。结果显示,参数规模较大的模型(如Llama 405B、GPT 4o和Claude Sonnet)表现最佳,能够准确复述各种经文,包括整章内容。而参数规模较小的模型(7B级别)容易混淆不同译本,甚至出现幻觉。中等规模的模型(70B级别)通常能保留经文的原意,但可能混杂多个译本,或略有改动。作者建议,若需准确引用圣经经文,应使用参数规模较大的模型,并辅以实际的圣经文本进行核对。
一篇由Mark Braverman和Or Zamir撰写的论文证明了频率矩估计的最佳空间下界为Ω(log(nε²)/ε²) ,其中ε = Ω(1/√n)。该研究解决了长期以来困扰计算复杂性领域的难题,在一定范围内,该下界与经典的Alon-Matias-Szegedy算法的上界相匹配。对于更小的ε值,论文还提出了一种改进的算法,进一步完善了频率矩估计的空间复杂度。这项突破性成果为流数据处理和算法设计提供了重要的理论指导。
一项令人震惊的全球研究发现,长期以来被认为呈U型曲线的幸福感与年龄的关系发生了逆转。过去,中年时期幸福感最低,而如今,年轻人成为了最不快乐的群体。这项研究分析了82个国家的数百万数据,发现自2017年左右,年轻人的幸福感急剧下降,尤其以年轻女性更为显著。这种变化不仅仅体现在幸福感上,还反映在焦虑、抑郁等负面情绪的上升以及自杀率的提高。研究人员指出,这种现象并非局限于美国,而是全球性的,其原因有待进一步研究。
一位AI爱好者花费12000美元搭建了一套拥有4块NVIDIA 4090显卡的本地训练大型语言模型(LLM)的设备。这套设备能够训练参数量高达10亿的模型,但最佳性能在约5亿参数的模型上。文章详细介绍了硬件选择(主板、CPU、内存、显卡、存储、电源、机箱和散热系统)、组装过程、软件配置(操作系统、驱动、框架、自定义内核)、模型训练、优化和维护等步骤,并分享了一些经验和技巧,例如使用George Hotz的内核补丁来启用NVIDIA 4xxx GPU的点对点通信。文章强调了本地训练的优势,但也指出了云服务的性价比更高。
AnkiAIUtils是一个利用AI增强Anki记忆卡片的工具套件。它通过结合ChatGPT、DALL-E和Stable Diffusion等AI模型,自动为学习者提供解释、记忆技巧、插图和自适应学习功能。该工具能够根据学习者的学习情况,动态匹配最相关的例子,并生成个性化的记忆技巧,支持多种LLM提供商和模型。目前该项目尚处于早期阶段,但已展现出巨大的潜力,有望彻底改变医学学习和其他领域的学习方式。