Fugatto:世界上最灵活的AI声音机器首次亮相
NVIDIA推出了一款名为Fugatto的生成式AI模型,它可以使用文本和音频作为输入,创建音乐、语音和各种声音的任意组合。Fugatto支持众多音频生成和转换任务,是第一个展现涌现属性的基础生成式AI模型,能够结合自由形式的指令。它可以根据文本提示创建音乐片段、从现有歌曲中移除或添加乐器、更改语音的口音或情感,甚至让人们创作前所未闻的声音。Fugatto为音乐制作人、广告公司、语言学习工具和游戏开发者等提供了新的创作可能性。
阅读更多
NVIDIA推出了一款名为Fugatto的生成式AI模型,它可以使用文本和音频作为输入,创建音乐、语音和各种声音的任意组合。Fugatto支持众多音频生成和转换任务,是第一个展现涌现属性的基础生成式AI模型,能够结合自由形式的指令。它可以根据文本提示创建音乐片段、从现有歌曲中移除或添加乐器、更改语音的口音或情感,甚至让人们创作前所未闻的声音。Fugatto为音乐制作人、广告公司、语言学习工具和游戏开发者等提供了新的创作可能性。
阅读更多
本文深入探讨了PPG Wave 2.2和2.3合成器之间细微却重要的区别。尽管2.3使用了12位DAC,但波表声音的回放仍然是8位的,只有通过外部设备导入的采样才能充分利用12位精度。文章通过示波器测量,揭示了其独特的音频处理方式:两个振荡器交错发送数据,DAC输出频率是单个振荡器采样率的两倍,这种方法创造了独特的音色,并产生了超出人类听觉范围的高频混叠。文章还分析了其CV更新速率相对较低,但音色依然富有特色。
阅读更多
Superstreamer是一个自托管平台,旨在简化视频交付的复杂性。它提供了一套从视频摄取到自适应播放的完整工具包,开发者可以通过简单的API调用和合理的默认设置将媒体转码并打包用于在线流媒体,或者动态创建包含片头、广告和滤镜的HLS播放列表。该平台支持将视频文件转码为不同质量的轨道(例如1080p、720p、480p),并将HLS CMAF播放列表直接写入S3以供播放。此外,它还支持插入类似Netflix的片头,将线性广告作为插播广告插入,并提供了一个简化的HLS.js facade,方便播放器构建者使用。
阅读更多
Hermes 3是一款基于Llama 3.1微调的开源AI模型,拥有高级的长期上下文保留、多轮对话、复杂角色扮演、内部独白和增强的代理函数调用能力。该模型在推理和创造力方面表现优异,并鼓励模型精确地遵循系统和指令提示。Hermes 3由Nous Research开发,提供8B、70B和405B三种版本。
阅读更多
Little Snitch发现macOS 15 Sequoia系统中的网络扩展框架存在内存泄漏问题,该问题会导致Little Snitch网络扩展占用大量内存。用户可以通过在终端运行`sudo leaks at.obdev.littlesnitch.networkextension | grep "total leaked bytes"`命令来检查是否存在此问题。该错误已报告给苹果(FB15552991),建议受影响的用户也通过Feedback Assistant向苹果报告。目前,用户可以通过活动监视器强制重启网络扩展来临时解决此问题。
阅读更多
俄罗斯佩чен加一座新学校的墙壁上出现了F-16战机的图案,引发公众强烈抗议。这些图案很快被移除,并被俄罗斯苏-57战机图案取代。学校解释称,原图是孩子们画的苏-27战机,但由于理解歧义,才做了修改。这一事件发生在靠近挪威和芬兰边境的军事小镇,进一步突显了地区紧张局势。类似事件也曾发生在其他军事设施,例如加吉耶沃海军基地,一栋建筑物上曾绘制了美国洛杉矶级核潜艇的图案,后被替换为俄罗斯潜艇图案。
阅读更多
Lunatic Fringe最初是After Dark屏保程序中的一个游戏,因其独特的魅力而备受90年代玩家喜爱。由于该游戏只能在经典的OS 9及以下系统运行,并且Sealie Software的OS X兼容版本也已停止支持,Lunatic Fringe面临着消失的风险。该GitHub项目旨在使用Web技术重制Lunatic Fringe,使其能够在任何现代Web浏览器上运行,并在不同平台和操作系统上都可玩。项目包含原始游戏的代码库,并提供了使用VS Code或Python搭建本地服务器运行游戏的方法。
阅读更多
保罗·埃尔德什是一位成就斐然的数学家,他的一生都献给了数学。他居无定所,没有家庭和财产,辗转于世界各地的数学会议和大学,与其他数学家合作研究。埃尔德什不仅在数学领域有着卓越的贡献,发表了1500多篇论文,而且为人慷慨,乐于助人,经常捐出自己所得,帮助有需要的数学家。他独特的性格和生活方式,以及对数学的热爱和奉献精神,令人敬佩。
阅读更多
2004年12月7日,Thunderbird 1.0发布,至今已走过20个年头。Thunderbird是一款免费的电子邮件客户端,不含广告和数据跟踪。其运营完全依靠用户的捐赠,目前只有不到3%的用户提供支持。官方呼吁更多用户捐赠,以支持Thunderbird继续发展。
阅读更多
本文介绍了一种规划、跟踪和管理产品变更的方法,旨在提升产品价值。该方法基于需求驱动,强调持续改进,并采用迭代式交付,以确保产品始终满足客户不断变化的需求。文章详细阐述了如何通过版本规划、问题和变更管理、测试和跟踪等手段来实现这一目标,并以Perforce为基础的信息系统为例,展示了该方法的实际应用。
阅读更多
Elm Partners进行了一项名为“水晶球挑战”的实验,让118名金融专业学生使用《华尔街日报》未来一天的新闻(但价格信息被遮挡)进行为期15天的股票和债券交易。结果令人大跌眼镜:尽管拥有“未来”信息,大多数参与者并未盈利,平均收益仅为3.2%。经验丰富的交易员则表现出色,平均收益高达130%。该实验表明,即使拥有“未来”信息,如果没有合理的仓位管理,也无法保证投资成功。这项研究强调了在不确定性下进行决策以及仓位管理的重要性,并为金融教育提供了宝贵的经验。
阅读更多
本文从程序员的角度探讨了不同排版引擎的优劣,重点关注其对高质量PDF生成和多语言(尤其是CJK)的支持。作者比较了HTML/CSS、LaTeX.js、LaTeX、Typst和React-pdf,并根据Knuth Plass断行算法、CJK排版、分页和即时预览等标准进行评估。最终得出结论,LaTeX是目前最适合PPResume的排版引擎,因为它具备优秀的断行算法和成熟的CJK支持,尽管它缺乏即时预览功能。其他引擎各有优劣,HTML/CSS灵活易用但排版控制力不足,LaTeX.js易于集成但功能有限,Typst新颖快速但CJK支持尚不成熟,React-pdf与React生态融合良好但排版功能不够专业。
阅读更多
RISC-V初创公司Ubitium宣布正在开发一款名为“通用处理器”的芯片,该芯片基于RISC-V架构,旨在将CPU、GPU、DSP和FPGA的功能集成到单个芯片和架构中。Ubitium称该处理器更小、更高效、成本更低,所有晶体管均可重复用于不同功能,无需专门的内核。该公司计划于2026年推出该处理器,目前已筹集370万美元用于原型开发和开发套件的创建,但要实现量产仍需更多资金。该项目面临的挑战包括资金不足和2026年这一雄心勃勃的发布日期。
阅读更多
谷歌已对欧洲搜索服务进行了20多项修改,以符合数字市场法(DMA)的要求,包括重新设计某些功能和移除其他功能。这些变化旨在提升比价网站的突出性,但也对航空公司、酒店和小型零售商等企业产生了负面影响,导致其网站流量下降。谷歌提议了进一步的更改,包括扩展单元格式以供用户在比价网站和供应商网站之间进行选择,以及新的广告单元。为了解这些变化的影响,谷歌将在德国、比利时和爱沙尼亚进行短期测试,移除酒店搜索结果中的一些功能,例如地图和酒店信息,并恢复到类似于以前的“十个蓝色链接”的格式。
阅读更多
jekyll-sqlite 是一个 Jekyll 插件,允许用户使用 SQLite 数据库作为数据源,方便地从数据库创建 API 和网站。它支持站点级查询、页面级查询和预处理查询,可以将现有数据作为参数。该插件配置灵活,可以定义数据源、数据库文件和查询语句,并支持参数绑定。此外,它与 datapage_gen 插件配合使用,可以根据数据库内容自动生成页面。
阅读更多
WASM音频解码器是一组Web Assembly音频解码库,针对浏览器使用进行了高度优化。每个模块都支持在主线程上进行同步解码,并通过内置的Web Worker实现进行异步(线程化)解码。解码器包括mpg123-decoder(解码MPEG Layer I/II/III)、flac-decoder(解码FLAC和Ogg FLAC)、ogg-opus-decoder(解码Ogg Opus)、opus-decoder(解码原始Opus)和ogg-vorbis-decoder(解码Ogg Vorbis)。这些解码器以NPM包的形式提供,并内置了Web Worker支持,体积小,性能高。
阅读更多
二战期间,为了防止日军空袭,美国西海岸的飞机制造厂被巧妙伪装成普通城镇。文章详细介绍了波音、道格拉斯、洛克希德等公司如何利用好莱坞电影场景设计师的技能,在厂房顶部和周边地区搭建房屋、街道、树木等,营造出逼真的郊区景象。文中还提及了当时民众的恐慌情绪以及对日军袭击的担忧,这些担忧促使了伪装计划的实施。即便日军从未真正空袭美国西海岸,这些伪装城市仍然在二战的美国本土记忆中占据一席之地。
阅读更多
本文介绍了如何通过优化物理资源和微调Google Cloud Dataflow管道的配置来降低成本。作者通过实际案例,逐步展示了优化过程。首先,作者分析了CPU和内存利用率,发现内存利用率低,通过调整CPU与内存的比率,节省了10%的成本。然后,作者比较了不同虚拟机类型的性价比,最终选择了性价比更高的T2D机器类型,并改用SSD硬盘,进一步降低了成本。最后,作者关闭了Shuffle Service,使内存利用率接近100%,最终成本降低了62%。
阅读更多
Elasticsearch是一个分布式搜索和分析引擎,可扩展的数据存储和向量数据库,针对生产规模工作负载的速度和相关性进行了优化。Elasticsearch是Elastic开放Stack平台的基础。它支持近乎实时的海量数据集搜索、向量搜索、与生成式AI应用程序集成等功能。Elasticsearch的用例包括:检索增强生成(RAG)、向量搜索、全文搜索、日志、指标、应用程序性能监控(APM)、安全日志等。文章提供了本地安装和运行Elasticsearch和Kibana的快速入门指南,以及通过REST API添加和搜索数据的示例。
阅读更多
Winlator是一款安卓应用,允许用户通过Wine和Box86/Box64在安卓设备上运行Windows (x86_64)应用程序。该应用已发布8.0版本,用户可从GitHub Release下载APK安装包。开发者提供了一些使用技巧,例如针对性能问题调整Box64预设、安装Wine Mono以支持.NET Framework应用以及设置环境变量以解决旧游戏兼容性问题等。
阅读更多
该GitHub仓库名为“awesome-awesomeness”,收集了各种编程语言、软件、工具、框架、库以及学习资源等精选清单。内容涵盖了软件开发的各个方面,从前端开发到后端开发,从移动端到桌面端,从人工智能到物联网,从安全到DevOps等,旨在为开发者提供一个便捷的资源查找平台。
阅读更多
本文讲述了罗伯特·克朗姆为詹尼斯·乔普林和她的乐队“大哥和控股公司”的专辑《廉价刺激》创作封面的故事。克朗姆并不喜欢当时的迷幻摇滚乐,甚至对乔普林的乐队也颇有微词,但他欣赏乔普林的蓝调才华。创作过程一波三折,乐队最初想用裸体照片做封面,但被唱片公司否决。后来的专业摄影师拍摄的照片也不尽人意。最终,克朗姆的漫画作品被选中,而他原本打算用作封底的漫画反而成了封面,成为了20世纪60年代末最具标志性的专辑封面之一。
阅读更多
由于美国持续限制中国人工智能发展,台积电已通知中国芯片设计公司,将从下周一起暂停生产7纳米及以下制程的先进人工智能芯片。未来台积电向中国客户供应此类芯片需经过审批流程,可能涉及美国。此举或将影响阿里巴巴、百度等中国科技巨头以及众多依赖台积电生产芯片的AI初创企业的雄心。台积电的这一决定是出于改进内部控制以及应对美国即将出台的新一轮芯片出口管制措施的需要,该公司尤其担心被视为不可靠或不合作。
阅读更多
Tom's Guide 的评测作者认为,对于游戏玩家而言,磁吸键盘是未来的趋势。相较于传统的机械键盘,霍尔效应磁吸键盘具有可调节的触发点和多重触发功能,可以实现更低延迟的输入和更丰富的自定义选项,例如在同一按键上设置行走和奔跑等操作。虽然机械键盘仍然有其优势,但磁吸键盘在游戏性能上的提升不容忽视。作者以 Corsair K70 Pro TKL、SteelSeries Apex Pro 和 Keychron K2 HE 等键盘为例,详细介绍了磁吸键盘的优势和功能。
阅读更多
Notion是一款多合一的工作区软件,它集成了笔记、任务管理、维基和数据库功能。用户可以在Notion上创建笔记、管理任务、构建维基知识库以及创建数据库。Notion旨在提供一个统一的平台,方便用户进行知识管理和团队协作。
阅读更多
长期以来,神经科学家认为记忆存储是大脑中印迹的工作,印迹是在学习过程中激活的神经元集合。但事实证明并非如此。贝勒医学院的研究人员发现,星形胶质细胞(非神经元脑细胞)在记忆的读写操作中发挥着关键作用。他们通过小鼠实验发现,星形胶质细胞在记忆形成过程中被激活,并与印迹神经元相互作用。人为刺激星形胶质细胞会增加印迹神经元的活动,而抑制特定星形胶质细胞中的NFIA蛋白会损害小鼠的特定记忆,但可以通过刺激印迹神经元来恢复记忆。这一发现表明,星形胶质细胞可以作为治疗创伤后应激障碍等疾病的新细胞靶点。
阅读更多
本文讨论了systemd在嵌入式Linux系统中的问题。systemd是一套集成化的系统管理应用程序,虽然它在通用桌面系统中表现良好,但在嵌入式系统中却存在一些不足。作者通过树莓派3B的内存使用情况进行对比,发现systemd组件的内存占用和启动时间都比传统替代方案更高。此外,由于systemd日益普及,维护非systemd替代方案的动力逐渐减弱,这使得嵌入式Linux的未来发展面临挑战。作者认为,尽管systemd存在这些问题,但抱怨并无济于事,因为发行版维护者已经非常喜欢它。
阅读更多
意大利那不勒斯附近的超级火山——坎皮佛莱格瑞火山区的活动日益加剧,其索尔法塔拉火山口每天排放大量的二氧化碳。研究人员发现,这些气体排放一部分来自岩浆,另一部分则来自地热流体与岩石的相互作用。自2005年以来,该地区气体排放量持续增加,并伴有小地震和地面变形,表明地下活动加剧,科学家正在密切监测,以预测火山活动并评估潜在风险。
阅读更多
本文讲述了深度学习的兴起如何出乎大多数人意料。文章以李飞飞教授创建ImageNet数据集的经历为主线,讲述了她在面对质疑时坚持推进项目的决心。ImageNet数据集的出现为深度学习的爆发奠定了基础,2012年,多伦多大学团队使用ImageNet训练的AlexNet模型在图像识别领域取得了突破性成果,标志着深度学习时代的到来。文章还强调了杰弗里·辛顿对神经网络的坚持,以及英伟达CEO黄仁勋对GPU通用计算平台CUDA的远见,这三个关键因素共同促成了深度学习的繁荣。
阅读更多