Lumalabs是一家人工智能公司,专注于使用机器学习和计算机视觉技术开发具有视觉感知能力的机器人。他们的研究领域包括目标检测、动作识别、行为预测和自然语言理解。他们的目标是创建能够理解和响应其周围环境的机器人。
Fusion Brain是一个使用Kandinsky神经网络生成图像的平台。在这个网站上,用户可以利用人工智能算法和技术创建独特而创意的图像。Kandinsky神经网络允许用户混合和组合不同的图像元素,创造出令人惊叹的组合和风格。
Runway Research Gen-2 是一个计算机视觉研究团队,他们致力于使用机器学习来解决视觉认知任务,例如图像生成、图像编辑、视频生成和视频编辑。他们展示了他们的研究项目、数据集、出版物和团队成员。
SadTalker 是一种通过人脸图像和语音音频生成说话人头像视频的新方法。它通过从音频中学习逼真的3D运动系数(头部姿势、表情),并隐式地调节一个新的3D感知人脸渲染器来生成说话人头像。该方法使用ExpNet从音频中学习准确的面部表情,并通过条件VAE设计PoseVAE来合成不同风格的头部运动。生成的3D运动系数被映射到所提出的人脸渲染器的无监督3D关键点空间,并合成最终视频。
HeyGen是一个AI视频生成器,可以通过使用AI生成的角色和声音轻松制作高质量的视频。通过选择或自定义角色、录制或选择声音以及选择模板或从头开始,用户可以在几分钟内创建令人惊叹的视频。
Decohere是一个AI视频生成网站,通过描述视频的文字内容并与音频同步,让用户能够创作出无法拍摄的视频,并提供不同风格的AI样式选择。Decohere可以免费使用,每月有25个视频和5000张图片的额度。
RealChar.AI是一个开源的 AI 角色聊天应用,可以实时用文字或者语音直接与 AI 角色对话 。可以随意打断聊天,变换换题,就跟与真人聊天一样,而且 AI 角色也有实时的各种背景信息。当前的角色有Elon Musk,蝙蝠侠,OpenAI CEO Sam Altman,Steve Jobs等。
Screenshot-to-Code 是一款开源AI开发工具,可根据截图自动转化为乱真并实际可用的源代码网页。Screenshot-to-Code利用GPT-4生成代码,并使用DALL-E3生成外观相似的图像。用户甚至可以直接输入要克隆的网站URL即可。
GenAct 是一个用于生成参与性代理的框架。参与性代理是在各种环境中执行任务的自主实体。GenAct 框架提供了一组可重用的组件,可用于构建和训练参与性代理。这些组件包括用于生成动作、感知环境和学习新技能的模块。GenAct 框架是开源的,可以在 GitHub 上获得。
screenshotone.com是一个提供网站截图服务的API平台。它提供了一系列的API方法,可以将网站、HTML或Markdown渲染为图像或PDF格式的截图。
该平台的特点包括:去除饼干通知、追踪器和广告、阻止复杂的GDPR和饼干同意表单、阻止广告、隐藏聊天小部件等。它还支持自定义选项,如暗模式渲染、添加自定义JavaScript和CSS、隐藏选择器和点击元素等。
此外,它还提供一些示例代码,展示了如何在不同的编程语言中使用该平台的API。用户可以通过免费注册获得每月100次免费截图的额度。
Boring Cash Cow旨在发现那些不起眼但能够稳定赚钱的业务,网站提供了一些无聊但赚钱的业务案例和报告,以及成功案例的展示。
movie-web 是一款轻松观看电影的网络应用程序,该服务通过直观美观的用户界面显示第三方供应商提供的视频文件。
movie-web是开源的,也可以部署托管到自己的服务器。
Magnific AI是一个提供图像升级和增强服务的网站。Magnific AI使用先进的人工智能技术实现高分辨率的图像升级,并能根据用户的提示和参数生成更多细节。
Magnific AI的最新版本可以将任何图像放大并增强至10,000 x 10,000 像素,一张很糊的图片,经Magnific AI增强后,无限放大,细节依然极致清晰。
对于Magnific AI的新版上线的这个功能,Elon Musk忍不住也在X上为它点赞。
Github发布的2023年报告,越来越多的开发者开始使用生成式AI进行构建。他们使用来自OpenAI等人工智能公司的基础模型,开源的生成式AI项目甚至进入了2023年贡献者数量最多的前10个开源项目之列。几乎所有开发者(92%)都在使用或尝试使用AI编码工具,预计开源开发者将在GitHub上推动下一波人工智能创新。
美国国家航空航天局(NASA)的每日一图网站提供来自世界各地和太空的最新、最引人入胜的图像,涵盖各种主题,包括科学发现、任务进展和技术突破。这些图片由专业摄影师、宇航员和科学家拍摄,为公众提供了探索宇宙的独特视角。
DeepL Translate是世界上最准确的翻译工具之一,每天有数百万人使用。它支持31种语言的文本翻译和文件翻译(如.pdf、.docx、.pptx),提供了强大的翻译模式和编辑功能。DeepL Translate被认为在准确性和细致度上超越了Google、Microsoft和Facebook等竞争对手,获得了业界的赞誉。它能够识别语言并自动转换成目标语言,助力用户轻松翻译和编辑文件。
Site-Shot是一个在线网页截图服务,提供用户友好界面和强大的API。它支持全页面截图、自定义浏览器选项和图像选项,适用于个人使用和应用程序集成。
随机街景,这个网站随机展示谷歌街景的照片。不知道干啥的时候,可以上这个网站看看,随机带你去一个谷歌街景逛逛,且还能鼠标移动位置,3D 操纵视角,非常震撼。
fal.ai是一个开源的AI图像生成网站,这个开源项目可以实时将草图渲染成真实的图片,背后使用的是LCM(Latent Consistency Models)模型,源代码在 Github 上开源了,自己可以任意修改使用,只需输入文本提示以及一张简单图片,就可以 按提示输出最终图像。
Vave Bg 是一个AI生成壁纸的仓库网站,所有壁纸都是由 AI 生成的,目前作为一个类似于Unsplash 的照片库运行,所有人 都可以自由下载,修改,分发甚至商业化。
绝大部分图片来自于 Midjourney,图片都有对应的提示词。