
近日,备受关注的AI大模型DeepSeek因服务器资源紧张,宣布暂停API服务充值功能,引发了业界和广大开发者的广泛关注。这一决定对于依赖DeepSeek服务的开发者来说,无疑是一个重...
2025-02-07
新闻资讯
150

谷歌搜索正在进行一项新功能的内部测试,该功能被称为 “AI 模式”,旨在为用户提供一个可以提出更开放式和探索性问题的 “持久性空间”。这一新体验基于谷歌的 Gemini2.0技术...
2025-02-06
新闻资讯
151

2025年2月5日,全球AI领域备受关注的DeepSeek因大规模高薪招聘再次登上热搜。此次招聘不仅为正式员工提供了极具吸引力的薪酬,实习生的待遇也同样令人瞩目,月薪轻松过万,引...
2025-02-05
新闻资讯
190

Loopy是由字节跳动和浙江大学联合开发的一款基于音频驱动的AI视频生成模型。它能够将静态照片或图像转化为动态视频,使照片中的人物能够根据输入的音频文件进行面部表情和头部...
2025-01-31
新闻资讯
188

VMix是一种新颖的即插即用适配器,通过细粒度的美学控制显著提升了文本到图像生成模型的性能。其灵活的设计和强大的功能使其在个性化图像生成、艺术创作、商业应用和教育培训...
2025-01-18
新闻资讯
181

StructLDM是一种从2D图像集合中生成3D人体的新型范式。它利用先进的深度学习技术和计算机视觉算法,从图像和视频中学习人体的高维表征,并通过结构化的自动解码器和隐空间扩散...
2025-01-16
新闻资讯
211

ViTPose 是一种基于视觉变换器(ViT)的人体姿态估计模型。视觉变换器最初由 Google Research 提出,用于图像分类任务,其核心思想是将图像分割成多个小块(patch),然后通过自注...
2025-01-15
新闻资讯
193

NeuralSVG是一种基于神经隐式表示的方法,旨在从文本提示自动生成矢量图形(SVG)。与传统的矢量图形生成方法不同,NeuralSVG通过将整个场景编码到一个小型的多层感知器(MLP)网...
2025-01-14
新闻资讯
185

AudioLCM 是一种基于一致性模型(Consistency Models, CMs)和潜在扩散模型(LDMs)的新型文本到音频生成模型。该模型通过集成一致性模型到生成过程中,并引入多步常微分方程(mul...
2025-01-13
新闻资讯
185

HelloMeme是一款开源的面部表情与姿态迁移框架,它利用先进的AI技术,特别是基于最新的Diffusion生成技术,实现了将视频中的人物表情和姿态迁移到静态图像中,生成个性化、趣...
2025-01-10
新闻资讯
184

LongWriter是由清华大学数据挖掘研究组(THUDM)开发的开源语言模型,旨在让大型语言模型(LLMs)能够生成超长文本。通过引入一种基于代理的“计划-写作”方法,LongWriter将复杂...
2025-01-09
新闻资讯
201

DiffSensei 是一个由北京大学、上海AI实验室及南洋理工大学共同推出的AI漫画生成框架。它旨在利用人工智能技术,将文本提示和角色图像转化为具有连贯性和视觉吸引力的漫画面板...
2025-01-09
新闻资讯
217

Windsurf是一款功能强大的集成开发环境(IDE),由Codeium团队开发。它被誉为世界上第一个基于AI Flow范式的IDE,旨在通过人工智能技术提升开发者的编程效率和体验。Windsurf...
2025-01-08
新闻资讯
223

Sonus-1是Sonus AI推出的一系列高性能大语言模型。该系列模型包括三个版本:Sonus-1 Mini、Sonus-1 Air和Sonus-1 Pro。这些模型旨在满足不同应用场景和性能需求,从快速响应的...
2025-01-07
新闻资讯
187

LatentSync是一项由字节跳动联合北京交通大学提出的创新技术,它代表了一种新型的唇部同步框架。该框架基于音频条件潜在扩散模型,旨在实现视频中人物唇部动作与音频的精准同...
2025-01-06
新闻资讯
314