首页 > Ai资讯
中国大模型融资暗战:罗曼蒂克的快速消亡
中国大模型融资暗战:罗曼蒂克的快速消亡

一场资本暗战   这是一场融资的突变。 在持续了一年多的中国大模型鏖战中,由杨植麟创办的月之暗面,尽管是一个是 […]

用ComfyUI整了一套照片转Q版手办的工作流
用ComfyUI整了一套照片转Q版手办的工作流

年后开工准备用SD的工作流版本ComfyUI整点东西出来。之所以要搞这个,主要是因为它跟我目前要做的很多内容都 […]

为什么说腾讯22年前的这份神级PPT是立项汇报的天花板?
为什么说腾讯22年前的这份神级PPT是立项汇报的天花板?

古早的互联网时代其实有很多非常经典和厉害的内容,这些内容不会随着时间的推移和环境的变化而失去价值。就像这篇文章 […]

图解 Transformer——功能概览
图解 Transformer——功能概览

一、引言 随着大型语言模型如 ChatGPT 的横空出世,我们进入了自然语言处理(NLP)的一个新纪元。在这个 […]

EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导
EmoLLM :一个用于心理健康领域的大模型项目 帮助用户进行心理健康辅导

EmoLLM 是一个用于心理健康领域的大模型项目,通过对大型语言模型(LLM)进行指令微调,旨在支持用户理解、 […]

最佳开源文生图大模型可图:安装与批量出图的完整教程
最佳开源文生图大模型可图:安装与批量出图的完整教程

Kolors可图是快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本图像对的训 […]

OpenAI 举行全体员工大会 推出了一个 AGI 等级体系 并展示了接近人类推理能力的模型
OpenAI 举行全体员工大会 推出了一个 AGI 等级体系 并展示了接近人类推理能力的模型

在最近的全体员工大会上,OpenAI 推出了一个五级评分系统,用于追踪其在开发超越人类能力的人工智能软件方面的 […]

OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练
OpenDiLoCo:一个分布式低通信模型训练开源框架 允许在全球进行分布式AI训练

Prime Intellect推出了OpenDiLoCo,这是DeepMind分布式低通信(DiLoCo)方法 […]

Google DeepMind 将Gemini 1.5 Pro安装到机器人上 实现机器人的记忆导航能力
Google DeepMind 将Gemini 1.5 Pro安装到机器人上 实现机器人的记忆导航能力

Google DeepMind 的机器人团队展示了将Google Gemini 1.5 Pro安装到机器人里面 […]

如何永久禁用 Windows 10 的自动更新!方法同样适合 Windows 11,防止系统被强制升级(2024) | LinksHub
如何永久禁用 Windows 10 的自动更新!方法同样适合 Windows 11,防止系统被强制升级(2024) | LinksHub

  如果你想要了解关于智能工具类的内容,可以查看 智汇宝库,这是一个提供智能工具的网站。 在这你可以找到各种智 […]

ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型

身体姿态估计旨在识别出给定图像中人或者动物实例身体的关键点,除了典型的身体骨骼关键点,还可以包括手、脚、脸部等 […]

自己电脑上跑大语言模型(LLM)要多少内存?
自己电脑上跑大语言模型(LLM)要多少内存?

在本地电脑上运行大型语言模型(LLM),需要考虑的关键因素之一就是电脑的内存够不够。希望能通过这篇文章让各位有 […]

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!

项目主页-https://fun-audio-llm.github.io/ 代码链接-https://gith […]

无限长的上下文,也干不掉的RAG
无限长的上下文,也干不掉的RAG

之前有一个论调,说如果大模型支持足够长的上下文内容时候,是否就不在需要向量库。下面这个论文,通过实验证明了,即 […]

EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频
EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频

EchoMimic 是由蚂蚁集团开发的一种通过音频和面部标志生成逼真的肖像动画视频的新方法。与传统的方法不同, […]

教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。
教你如何使用 AI 在几秒钟内将 YouTube 视频转换为SEO博客文章。

现在你可以在几秒钟内将 YouTube 视频转换为博客文章... Support authors and su […]

Google新的 AI 训练技术 使得模型训练速度快了 13倍 效率提高了 10倍
Google新的 AI 训练技术 使得模型训练速度快了 13倍 效率提高了 10倍

DeepMind 发布了一项新的研究,声称其新方法可以将 AI 模型的训练速度和能效大幅提升一个数量级,以高达 […]

ULTRAEDIT:通过多样化的图像编辑指令 轻松通过文本任意编辑图像
ULTRAEDIT:通过多样化的图像编辑指令 轻松通过文本任意编辑图像

ULTRAEDIT 是一个大规模、自动生成的数据集,专门用于基于指令的图像编辑。 使得你可以通过自然语言描述的 […]

教程:使用 IC 灯光变换器重新照亮您的视频 随意更换视频背景和光照
教程:使用 IC 灯光变换器重新照亮您的视频 随意更换视频背景和光照

在这个教程中,我们将详细介绍如何使用ComfyUI IC-Light工作流来重新照明你的视频。通过一系列简单的 […]

APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用
APIGen:生成多样化且可靠的函数调用数据,通过语言指令即可执行功能性API调用

APIGen是一个自动化的数据生成流水线,旨在为函数调用应用程序生成高质量的可验证数据集。 其主要目标是生成多 […]

SD 美颜修图神器
SD 美颜修图神器

前言 听雨貌似好久没有介绍 SD 的插件了,今天听雨给小伙伴们带来了一个 SD 的美颜修图神器,可以在我们生成 […]

大模型落地“诸神之战”,场景玩家先杀出重围了
大模型落地“诸神之战”,场景玩家先杀出重围了

都说今年是大模型落地元年,但实际进展还是快得超出想象了。 这不,在一年一度的AWE(中国家电及消费电子博览会) […]

AI声音克隆 | 最全最简教程(权威版)
AI声音克隆 | 最全最简教程(权威版)

一直没有写过关于声音克隆的文章,所以这次补上,毕竟这个用的还真是有点多,也为后面更多的个性化配音做好准备。   […]

Stable AI 为 Stable Assistant 添加了两个新功能 搜索替换图像中的对象 生成3分钟音频
Stable AI 为 Stable Assistant 添加了两个新功能 搜索替换图像中的对象 生成3分钟音频

Stable AI 为其 Stable Assistant 机器人添加了两个新功能。现在,用户可以使用“搜索替 […]

麻省理工学院推出数据库生成式AI 只需按几下键就能对表格数据进行复杂的统计分析
麻省理工学院推出数据库生成式AI 只需按几下键就能对表格数据进行复杂的统计分析

麻省理工的的研究人员推出了一种名为 GenSQL 的生成式 AI 数据库分析系统,旨在简化数据库用户进行复杂统 […]

Claude 推出针对开发者自动生成提示词 并测试提示效果的工具
Claude 推出针对开发者自动生成提示词 并测试提示效果的工具

在构建人工智能驱动的应用程序时,提示词的质量对结果有重大影响。然而,编写高质量的提示词具有挑战性,需要深入了解 […]

三星推出 Galaxy Ring 智能戒指 可以进行7×24小时全天候健康监测
三星推出 Galaxy Ring 智能戒指 可以进行7×24小时全天候健康监测

三星电子宣布推出新的Galaxy Ring、Galaxy Watch7和Galaxy Watch Ultra, […]

FoleyCrafter:精准的为无声视频自动配音 生成同步且逼真的声音
FoleyCrafter:精准的为无声视频自动配音 生成同步且逼真的声音

FoleyCrafter 是一个能够为无声视频生成同步且逼真的声音效果的开源系统。用于自动生成与视频同步的高质 […]

让老照片动起来!通过 AI 一键搞定,按要求生成动态视频
让老照片动起来!通过 AI 一键搞定,按要求生成动态视频

岁月如沙,从指缝悄然流逝。那些定格在泛黄照片里的笑脸,曾是我们最珍贵的瞬间。如今,科技让逝去的时光重现生机,让 […]

TTT:一种新型的语言模型架构 能处理更长文本 性能优于Transformer模型
TTT:一种新型的语言模型架构 能处理更长文本 性能优于Transformer模型

测试时间训练(Test-Time Training, TTT)是由斯坦福大学、加州大学和Meta AI共同研究 […]


1 2 3 108