AI行业热闻快讯

11月30日·星期四

■ Pika 1.0 发布全新 AI 模型,为视频创作带来了全新的体验
AI 初创公司 Pika Labs 正式发布了其令人印象深刻的 AI 视频生成器的 1.0 版本,为视频创作带来了全新的体验。除了之前的生成视频功能,还增加了 3D 视频生成、视频局部重绘、视频扩展生成等等。也就是说,现在能够使用文本生成和编辑多种风格的视频,如3D动画、动漫、卡通和电影风格。>>一键直达

■ AI 生成图片著作权第一案判决:智能生成图片受到著作权法保护
日前北京互联网法院对 AI 生成图片相关领域著作权第一案作出一审判决,认定被告构成侵权,需向原告公开道歉,并赔偿 500 元。据庭审公开内容,在这起案件中,原告利用人工智能大模型,通过输入提示词的方式,生成了一张人物图片,后将该图片发布在某网络平台。被告在个人账号上使用该图片作为文章配图发布,原告以侵害作品署名权和信息网络传播权为由将被告起诉到北京互联网法院。最终法院认定,涉案人工智能生成图片(AI 绘画图片)具备「独创性」要件,体现了人的独创性智力投入,应当被认定为作品,受到著作权法保护等。

11月29日·星期三

■ 抖音即创官网体验入口,公测版本上线
「抖音即创」是一个一站式智能创意生产与管理平台,集成了视频创作、图文创作、直播创作等多种创意工具。通过 AI 技术,它能够大幅提高创作效率。主要功能和优势包括:视频创作,内置多种 AI 视频创作工具,支持智能编剧、数字人物、一键成片等,可快速生成高质量视频内容;图文创作,提供智能图文和商品图片生成工具,可快速制作微信文章、产品详情等图文内容;直播创作,支持 AI 直播背景、直播文案等创作工具,可轻松制作抖音、快手等直播内容。>>测试入口

11月23日·星期四

■ Sam Altman 确认回归 OpenAI,重新担任首席执行官
据 OpenAI 官方社交媒体消息, 创始人 Sam Altman 将回归公司并重新担任首席执行官一职。同时,公司将组建全新董事会。据悉,新任董事会的初始成员包括 Bret Taylor (主席)、Larry Summers 以及 Adam D’Angelo 。

■ Stability AI 推出视频生成模型 Stable Video Diffusion
Stability AI 最近发布了视频生成模型 Stable Video Diffusion,基于其 Stable Diffusion 文本转图像模型,可通过动画化现有图像生成视频,但目前仍处于研究预览阶段,有特定使用条款,限制应用于「教育或创意工具」等领域,禁止用于「真实事件或人物的表现」。

■ ChatGPT 语音旁白功能现已向所有免费用户开放
OpenAI 宣布将 ChatGPT with voice 语音功能免费对所有用户开放,用户只需下载应用程序,点击耳机图标即可进行语音对话,此功能于今年 9 月推出,最初仅面向 Plus 和 Enterprise 用户。

11月21日·星期二

■ 微软官宣「ChatGPT 之父」加盟,将为其组建一个新的 AI 研究团队
科技巨头微软 CEO 萨提亚·纳德拉(Satya Nadella)宣布,刚被 OpenAI 公司解雇的两位人工智能领域的重磅人物,将率团队加入微软公司。纳德拉在社交媒体上写道,「我们很高兴地宣布,山姆·奥特曼(Sam Altman)、格雷格·布罗克曼(Greg Brockman)及他们的同事将加入微软,领导一个新的高级 AI 研究团队」。

■ WPS 回应隐私政策质疑:声明用户文档不会被用于 AI 训练
WPS 更新了其「隐私政策」,里面提到「我们将对您主动上传的文档材料,在采取脱敏处理后作为 AI 训练的基础材料使用」,该表述被质疑涉及用户隐私问题。对此,WPS 发表回应称,「我们已经更新了《WPS 隐私政策》,去除了容易引起误解的表述,并确保其内容与我们的实际操作严格对应」。同时,WPS 表示,「我们郑重声明,所有用户文档不会被用于任何 AI 训练目的,也不会在未经用户同意的情况下用于任何场景」。

11月17日·星期五

■ 微软确认将把 Copilot 聊天机器人引入 Windows 10
微软表示,它将很快开始在广泛使用的 Windows 10 操作系统的更新中测试 Copilot 聊天机器人,适用于家庭版和专业版的 Win10 操作系统。>>体验网页版

11月15日·星期三

■ 服务压力陡增 OpenAI 宣布暂停 ChatGPT Plus 会员注册
近日 ChatGPT Plus 使用量的激增超出了 OpenAI 的承受能力,为确保每个人都有良好的体验,暂停 Plus 会员注册。虚拟产品卖断货,真是活久见!

■ OpenAI 创始人透露 GPT5 已在训练中
OpenAI 创始人在采访中透露,公司正积极训练 GPT-5,与微软合作进展顺利,发布了 GPT-4Turbo 和 GPTStore,计划筹集更多资金解决构建更复杂 AI 的高成本问题。强调对通用人工智能(AGI)的追求,呼吁征集大规模数据集以训练新模型。

11月14日·星期二

■ Runway 推新功能运动笔刷,随手一涂静图变动图
Runway 推出的新功能「运动笔刷」让 Gen-2 视频生成工具再次颠覆 AI 圈,摆脱文字依赖,手势操作即可赋予静态图片动感,创造可控制生成内容的新方法。

11月13日·星期一

■ 微软因安全问题暂时禁止员工使用 ChatGPT
据外媒报道,微软一度临时禁止其员工使用 ChatGPT,理由是出于对安全和数据问题的关切。尽管多家科技公司以往曾禁止或至少不鼓励内部使用 ChatGPT,但微软这一决定引起了瞩目,尤其是考虑到微软是 OpenAI 最大和最显著的投资者之一。微软称,对 ChatGPT 的暂时封锁是对大型语言模型系统进行测试时出现的错误。

11月11日·星期六

■ 抖音剪映测试 AIGC 工具 Dreamina,可生成创意图片
剪映 Dreamina 是抖音旗下的 AIGC 工具,用户可以根据文本内容生成由 AI 生成的创意图,支持修整图片大小比例和模板类型。未来会用于抖音的图文或短视频的内容创作,丰富抖音在 AI 创造方面的内容库。>>官网直达

■ OpenAI 推出企业定制版 GPT-4,起步价 200 万美元
本周早些时候,除 OpenAI 开发者大会外,OpenAI 还低调推出了定制化 GPT-4 模型的服务。根据 OpenAI 的说法,它会选择一些特定客户,基于这些客户自己的私有数据,构建定制化的 GPT-4 模型,生成针对每个客户业务的自定义结果。OpenAl 还表示,每个客户的定制流程需要花费几个月的时间,起步价为200万美元。

11月10日·星期五

■ OpenAl: ChatGPT 服务周期性中断因遭到 DDoS 攻击
OpenAl 在官网更新消息称,正在处理因反映 DDoS (分布式拒绝服务)攻击的异常流量而导致的周期性中断。此前,OpenAl 发文称,ChatGPT 和 API 仍会出现周期性中断。当日更早些时候,OpenAI 的 ChatGPT 和 API 服务出现严重中断故障,导致面向用户和开发者的服务无法正常使用。

11月8日·星期三

■ OpenAI 推出自定义版 ChatGPT:正式推出了 GPT-4 Turbo
OpenAI 在首届开发者大会上,正式公布自定义版 GPT,还将上线「GPT 商店」,与创作者分享收入。据介绍,无需编码,任何人都可以轻松创建自己专有版本的 GPT,该功能将可供 ChatGPT Plus 和企业版订阅用户使用。OpenAI 还计划在本月晚些时候推出 GPT 商店,用户可以在那里找到其他用户定制的 GPT,并通过自己的 GPT 赚取收益。OpenAI 还表示,将推出最新的 GPT-4 Turbo 预览版,这是支撑该公司技术的大语言模型的更强大、更快速的版本。

■ 美团推出 AI 聊天应用 Wow:年轻人的 AI 朋友社区
「Wow」是一款专为年轻人设计的 AI 聊天产品,被称为年轻人自己的 AI 朋友社区。用户可以随时随地进入各种幻想世界,并与 AI 伙伴进行角色扮演,感受漫画小说中的场景,实现自己心中的想象。请注意,这里的聊天没有真人的参与,而是基于 AI 技术构建的伙伴们。目前该应用还不支持自定义 AI 角色,只能在官方提供的内容中选择。

11月7日·星期二

■ 李开复官宣全球最强开源大模型 Yi-34B,一次可处理 40 万汉字
零一万物推出了「Yi」系列开源大模型,其中 Yi-34B 在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B 的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。>>在线体验

■ 推特首个 AI 大模型 Grok 发布
近日,马斯克在 X(原推特)上公布了新 AI 工具 Grok 的详细信息。马斯克表示,Grok 目前正在早期测试阶段,测试完成后将向所有 X Premium+(X 上周新推出的高价订阅方案,每月收费 16 美元)订阅者开放;Grok 可以实时访问 X 平台上的数据,这是其相对于其他模型的巨大优势。>>官方网站

11月6日·星期一

Midjourney 推出 Style Tuner 工具,让用户自定义视觉风格模型
Midjourney 的 Style Tuner 工具允许品牌、企业和创作者以一致的风格生成多个图像,用户可以自定义风格并应用于所有后续生成的图像,取代了以前需要重复文本描述的方法,提供更大的灵活性和控制。>>详细教程

■ Gen-2 更新:允许用户通过简单文本生成 4K 高清视频
Runway 的 AI 视频生成工具 Gen-2 经历了一次重大更新,允许用户通过简单的文本输入来生成 4K 高清视频,彻底改变了创意软件的方式。>>体验地址

11月2日·星期四

■ Open AI 首席科学家称 ChatGPT 可能已经具有自主意识
OpenAl 联合创始人兼首席科学家近日接受麻省理工科技评论的采访时表示,他的首要任务并非制作下一个 GPT 或 DALL-E,而是研究如何阻止超级 AI 的失控。他认为 ChatGPT 可能是有意识的,世界需要清醒地认识到 AI 真正的力量,总有一天,人类会选择与机器融合。

11月1日·星期三

■ 百度文心一言推出会员: 连续包月 49.9 元,可解锁文心大模型 4.0
百度大模型文心一言现已推出会员模式,开通后可解锁文心大模型 4.0。据介绍,文心一言会员单月购买价格为59.9 元,连续包月价格为 49.9 元(次月以 49.9 元/月自动续费,可随时取消)。此外,百度还推出了文心一言+文心一格 (白银)的联合会员,价格为 99 元/月

10月30日·星期一

■ OpenAI 估值飙升,成为全球第三最有价值初创公司
OpenAI 的估值预计将达到 800 亿美元,使其成为全球第三最有价值的初创公司,仅次于 TikTok 的字节跳动和 Elon Musk 的 SpaceX。

10月28日·星期五

■ Runway 举办的 AI 视频大赛 GEN48 开放投票
各位可以去看看有哪些值得投,还有就是在专业人士手里AI视频可以做到什么程度。>>地址

■ SDXL 推精简版本 SSD-1B,推理速度提升 60%
Segmind Stable Diffusion1B(SSD-1B)是一款高效、高速的文本生成图像 AI 模型,为图像生成提供广泛可能性,它是稳定扩散 XL 的精简版本,体积减小 50%,但速度提升 60%。该模型经过多种数据集的训练,能有效处理各种文本提示。>>试用地址

10月25日·星期三

■ Midjourney 网站推出测试版
Midjoureny 一直说的新版网站终于上线了,体验好了非常多。 最重要的图片搜索现在变得非常快,从网站显示看图片生成也会很快上线。如果运行正常这个网站将很快替代现有网站。正如他们之前宣布的那样,这是第一阶段。目前还没有图像生成,它将在下一阶段添加。>>更多细节

■ B 站测试推出「AI 视频总结」功能
近日 B 站开始测试推出「AI 视频总结」功能。获得测试资格的用户将在视频播放页面的右下角显示「AI 视频总结」测试版按钮,点击即可生成视频总结,用户可以通过总结点击跳转到视频的相关定位。

10月20日·星期五

■ Midjourney 推出2倍放大和4倍放大功能
放大后的图片有更多细节

10月19日·星期四

■ 英伟达推出插件 TensorRT 提升 Stable Diffusion 性能
如果你的SD用的是英伟达RTX系列显卡和Automatic1111 WebUI,那推荐安装这个插件,可以提升SD出图性能。安装插件后,点击生成引擎(需要2-10分钟),才会真正生效。>>Github

■ 百度大模型智能编程助手 Comate 将在 10 月 24 日全面开放
百度将于 10 月 24 日全面开放 Comate 智能编程助手, Comate 是基于文心大模型开发的智能编码助手,结合多年编程数据和优秀开源数据,提高编码效率。这一自研的 AI 应用已在内部广泛使用,为工程师提供优质代码生成和编码支持。

10月18日·星期三

■ 百度网盘史诗升级:能精准定位到视频某一帧
百度世界 2023 上,李彦宏发布文心大模型 4.0 版本,并带来新搜索、新地图等十余款 AI 原生应用。通过对海量文档、图片和视频的理解和再生成,百度网盘拥有了创作能力。百度网盘不仅能精准定位到视频某一帧,还能在几秒钟内总结完长达 1 小时的视频内容,并从中提炼出金句和要点。

■ 全球最大图片库「Getty Images」推出 AI 生成工具 Generative AI by Getty Images
最近,Getty 推出了自己的 AI 生成工具 Generative AI by Getty Images。该产品根据 Getty Images 的创意内容进行训练,而且还会向这些内容的创作者支付「报酬」。同时该模型还结合了英伟达(Nvidia)提供的 Edify 大模型,可在英伟达的生成式 AI 模型库 Picasso 上使用。

10月17日·星期二

■ 阿里魔搭社区开源知识检索模型 Ziya-Reader
阿里魔搭社区宣布开源 Ziya-Reader(姜子牙),一款出色的知识检索模型,当前大模型在处理多文档任务时,如果正确答案不在第一个或末尾的文档中,准确率会急剧下降。为了解决这个问题,Ziya-Reader 应运而生,它可以从多个候选中找到正确的答案。>>一键直达

10月16日·星期一

■ 保护用户免受侵权,谷歌称将承担 AI 产品法律风险
谷歌近日宣布,将保护使用其旗下 7 种产品的用户不受潜在侵权行为影响。这一举措旨在缓解人们对生成式 AI 可能带来的版权问题的担忧。具体而言,受到保护的产品包括 Workspace 中的 Duet AI(文档处理工具和 Gmail 中生成的文本、图像以及视频会议工具中的图像),以及云端服务中的 Duet AI、Vertex AI 搜索、Vertex AI 对话、Vertex AI 文本嵌入 API 和 Codey API 等。

10月15日·星期日

■ Morph Studio:又一个文字生成视频的AI
特色是不限制内容,可以生成18+的视频。>>Discord

Niji·journey 官方APP上线
美区App Store可以下载,有20次免费生成次数。

■ Adobe 透明图标符号「cr」诞生,可查看图片详细信息
Adobe 联合多家公司成立的 C2PA 联盟开发了一个特别的符号,然后与元数据(Metadata)一起附加到内容上,以确定其出处,包括它是否是用人工智能工具制作的。这个符号今后将通过 Adob​​e 的照片和视频编辑平台(如 Photoshop 或 Premiere)以及微软必应图像生成器来添加至图像、视频和 PDF 的元数据中,以展示数据的所有者和创建者。当用户在网上查看照片时,他们可以将鼠标悬停在该符号上,立刻会以下拉菜单的形式显示出当前照片的数据。其中包含有关其所有权、用于制作照片的人工智能工具以及有关媒体制作的其他详细信息。>>阅读原文

■ 谷歌搜索推出文生图功能 SGE
谷歌于官网宣布推出 AI 驱动的生成搜索体验(Search Generative Experience,SGE)功能,可在搜索引擎中根据文本提示生成图像。谷歌称,为了保障安全,通过 SGE 生成的每张图片都将带有元数据标签和嵌入式水印,以表明它是由 AI 创建的,同时采取了严格的过滤策略以防止不当内容的出现。

10月12日·星期四

■ Adobe 重磅发布 Firefly Image 2
在备受瞩目的 Adobe Max 2023 大会上,Adobe 推出了三款新的生成式人工智能模型:Firefly Image 2 Model(第二代萤火虫图像模型)、Firefly Vector Model(萤火虫矢量模型)和 Firefly Design Model(萤火虫设计模型)。这些新模型与 Adobe Photoshop、Illustrator 和 Express 工具结合,为设计师提供更强大、更智能的生产力。其中,文生图模型 Firefly Image 2 已经在 Adobe Firefly 官网上线,用户可以免费体验。与之前的 Image 1 相比,Firefly Image 2 在图像生成质量上有了极大提升,并增加了5种新功能。>>简介/教程/一键直达

■ 支付宝上线「AI 写真馆」,支持多种主题选择
用户上支付宝搜「AI 写真馆」,选择性别、场景、上传照片,即可生成一组「AI写真」,操作简单、快速、支持自动识别或手动设置年龄层。目前为限时免费阶段,首次使用即可获得 10 张 AI 写真体验照片,支持高清图片保存本地。 目前有中秋、我的航天梦、时尚写真等主题,多人合照、全家福等主题写真服务也在路上了。

■ Meta 开源数字水印 Stable Signature,极大增强生成式 AI 安全
Meta 在官网宣布,开源数字水印产品 Stable Signature,据悉,Stable Signature 是由 Meta 和 INRIA(法国国家信息与自动化研究所)联合开发而成,可将数字水印直接嵌入到 AI 自动生成的图片中,防止其非法用途。>>开源地址

10月9日·星期一

■ 淘宝:国庆期间 AI 修图服务搜索量周环比暴增数十倍
淘宝公布数据显示,除了出行预订,淘宝上的「懒人旅游」服务也大受欢迎。景点代打卡、代 P 图、代排队等服务火爆,代打卡和代排队服务销量相比平时增长超过 5 倍,AI 修图服务搜索量周环比暴增数十倍,有商家销量增长 1000%。>>AI修图工具大全

■ 「百度世界大会 2023」将于 10 月 17 日举行,带来应用产品的全新亮相
百度宣布将于 10 月 17 日举行「百度世界大会 2023」,李彦宏透露将带来文心一言、搜索、地图、网盘等应用产品的全新亮相。李彦宏将在主题演讲中分享 AI 原生应用的心得,重点介绍生成式 AI 的想象和创新空间。

10月8日·星期日

■ 对标 ChatGPT,亚马逊计划推出 AI 聊天机器人
亚马逊正打造一款 AI 驱动的聊天机器人,并拟将其整合进亚马逊网站的搜索栏中,可优化客户在其电商网站的搜索体验,最快可能在明年 1 月推出。据悉,该项目的内部代号为 Project Nile,将在亚马逊现有搜索栏的基础上,增加一层人工智能,实现即时产品比较,允许用户提出更具体化的问题,以及基于搜索上下文和个人购物数据,给出更精准的推荐。人工智能支持的互动搜索,可以改善亚马逊的购物体验。

■ Canva 发布全套 AI 设计工具 Magic Studio,让设计变得更简单
Canva 发布了 MagicStudio,这是一套 AI 设计工具,旨在通过自动化设计任务来使内容创作更加普及,无需设计经验。 Magic Studio 引入了诸如 Magic Switch 等功能,可自动将设计转换为博客、社交媒体帖子、电子邮件等,节省手动编辑的时间。>>体验地址

9月28日·星期四

■ Meta 发布自己的AI聊天机器人:拥有超过 28 个名人角色
用户将能够使用自然语言提示与其进行交互。该聊天机器人建立在源自 Meta 的 LLaMA 2 LLM 的自定义模型之上,并将使用 Microsoft Bing 从网络中提取实时信息。>>详细介绍

9月26日·星期二

■ ChatGPT 迎来大升级:支持图片和语音输入
近日 OpenAI 宣布推出新版 ChatGPT,增加了两项新功能:语音输入和图像输入。据 OpenAI 称,新功能将在未来两周内向 ChatGPT Plus 订阅用户推出。据悉,语音功能将在 iOS 和 Android 平台推出,图像功能将覆盖所有平台。

■ 阿里妈妈腾讯广告合作深化,微信广告可直跳淘宝天猫
阿里妈妈与腾讯广告进一步深化合作:微信视频号、朋友圈、小程序等广告流量通过阿里妈妈 UD 效果广告,可直跳淘宝、天猫商家的店铺、商品详情及淘宝直播间。对今年的天猫双 11,双方还将共同启动「双 11 超引爆计划」,投入亿元补贴商家。

9月25日·星期一

■ OpenAI 发布 DALL·E 3
OpenAI 的文生图 AI 工具 DALL-E 系列迎来了最新版本 DALL·E 3,OpenAI 表示,「DALL·E 3 比以往系统更能理解细微差别和细节,让用户更加轻松地将自己的想法转化为非常准确的图像。」这次 OpenAI 直接把 DALL·E 3 和 ChatGPT 集成到了一起。直接省去了提示词工程(Prompt Engineering)这一步,用户只要发挥想象,词由 ChatGPT 帮助拓展,非常方便。>>详细介绍

9月21日·星期四

■ GitHub Copilot Chat 现已对所有个人用户开放
GitHub Copilot Chat是一个AI助手,专为程序员设计,用于在编程过程中提供实时建议和解决方案。它与GitHub Copilot一起工作,使开发者能够使用自然语言与其交互,从而更快速、更高效地编写代码。

■ 妙鸭相机推出免费体验版,8 张照片即可生成专属数字分身
2023 年金山办公技术开放日上,金山办公宣布了智能办公助手 WPS AI 的最新进展。WPS AI 已接入金山办公全线产品,用户可以体验全组件 AI 功能。金山办公表示还将将 AI 技术开放赋能给企业客户,帮助他们打造一站式协作办公平台。

■ 金山办公:WPS AI 已接入金山办公全线产品
前阵子爆火的妙鸭相机推出免费体验版,用户上传 8 张照片即可生成个人数字分身,之前需上传 20 张照片并支付费用。妙鸭相机通过技术优化,提高数字分身相似度,希望扩大用户群体。

9月20日·星期三

■ AI 新艺术:螺旋控制图像 Illusion Diffusion 爆火
AI 创作了一种新的艺术形式,引发了近 700 万网友的围观,使用 ControlNet 技术,创造了一种螺旋图形的错觉图像,受到广泛关注。有网友甚至直接在 Hugging Face 上制作了——Illusion Diffusion,普通用户只要打开浏览器就能玩。
>>试玩地址

9月19日·星期二

■ OpenAI发布新的GPT-3.5-Turbo-Instruct
它能够更准确地理解和执行用户的指令,提供更高质量的答案,避免啰嗦,并在处理各种任务时表现出更强的适应性和灵活性。
>>官方介绍

■ 谷歌推出生成式图像动力学:让静态图片动起来
谷歌团队提出「生成图像动力学」技术,可以将静态图片转换成动态无缝循环视频,以及让用户与图片中的对象进行交互。
>>体验地址

9月18日·星期一

■ Google推出了 emoji kitchen 在线体验
可以自己制作表情了!傻瓜式操作,选择两种表情会组合生成新的,也可以用随机模式!有点意思。
>>Google 搜索 emoji kitchen 即可

■ 《马斯克传》省流版
《马斯克传》读起来一点都不累,50万字的篇幅虽然看起来很长,但是你在阅读中很快就会发现整本书完全按照同一种模式在循环:
马斯克有个新的想法→马斯克立即找人来做→新想法进展不顺利→马斯克入驻现场→马斯克开除员工→马斯克给出匪夷所思的期限→马斯克逼疯所有人→所有人振作起来→伟大的成功→马斯克感到沮丧和抑郁—马斯克找了个新的女人→马斯克生的孩了→马斯克有个更新的想法….

■ Nvidia推出了Code Llama在线体验
测试了下,让它说中文就是不说,但是你说中文他能听懂并用英文回答。最重要的是输出速度挺快,比GPT快起码3倍吧!代码能力你们自己测测吧!
Code Llama 是 Llama 2 的代码专用版本。它可以根据自然语言提示生成可以生成 Python、C++、Java 等流行语言的代码。>>一键直达

9月14日·星期四

■ Stability AI 推出音乐生成工具 Stable Studio
Stability Al 推出Al 音乐生成工具 Stable Audio,用户只需输入文本描述想要的音乐和音效(提示语可以包括流派乐器、情绪、节拍数等细节),便能自动生成音频。>>一键直达

9月12日·星期二

C站发布了一个新功能:Civitai 图像生成器
可以使用站内的数百种模型和 LoRA 来生成图片。不用再配置昂贵的电脑了!
重点:可以生【成人内容】
注册后再网站右下角有个:Create 按钮,点击即可弹出生图页面,选择模型、设置、输入Prompt,即可排队生成。一次最多可输出10张图,默认4。>>一键直达

■ CodeFuse:蚂蚁推出的一个开源代码大模型
能够根据开发者的输入,提供智能建议和实时支持,包括自动生成代码、添加注释、生成测试用例以及修复和优化代码等功能。CodeFuse基于蚂蚁集团的基础大模型开发而成,该模型在最近的代码补全评测中表现优异,得分达到了 74.4%,超过了 GPT-4 和 WizardCoder-34B。>>项目地址

9月11日·星期一

■ 腾讯云 AI 绘画产品发布:支持超 25 种生成风格
2023 腾讯全球数字生态大会上,腾讯云正式推出全新的 AI 绘画产品,它依托腾讯自研的 AI 绘画模型,提供 AI 图像生成与编辑技术 API 服务,使用户能够轻松地根据输入的文本或图片,智能创作出与输入相关的图像内容。目前,腾讯云官网已开放申请体验通道。>>内测申请

■ 微软宣布为商业客户提供新的 Copilot 版权承诺:将承担潜在法律风险
微软公司宣布,如果商业客户因使用其人工智能产品 Copilot 生成的内容遭侵权诉讼,微软将承担法律责任。微软表示,只要客户使用了 Copilot 中的内置防护措施,公司将承担第三方的任何潜在诉讼风险。

9月10日·星期天

■ 文字生成音乐迎来Midjourney时刻
文字生成音乐AI模型Suno发布重大更新!支持包括中文在内50多种语言,效果直接拉满 >>演示/教程/一键直达

9月9日·星期六

■ Runway 新增镜头控制功能
RunwayML Gen2 新增平移、旋转和缩放视频镜头功能,同时控制镜头的移动方向速度。

9月7日·星期四

■ Claude.ai 推出 Claude Pro 计划
每月价格为 20 美元(美国)或 18 英镑(英国),客户将获得更多消息容量、高流量期间的优先访问以及抢先体验新功能。

■ 微信上线「腾讯混元助手」多模态对话小程序
微信上线了一款名为「腾讯混元助手」的小程序,同时,「腾讯混元」公众号也正式上线。据小程序介绍显示,「腾讯混元助手」是腾讯混元大模型多模态对话 Bot 产品,可以回答各类问题,也能处理多种任务,如:获取知识、解决数学问题、翻译、提供旅游攻略、工作建议等。>>详细介绍

9月6日·星期三

■ 哈佛大学发布首份教师使用生成式 AI 指南
哈佛大学文理学院将生成式 AI 工具如 ChatGPT 等引入课堂,并发布了使用指南。指南重点保护非公开数据,教师不得将学生作业输入到 AI 系统内,同时强调数据安全和隐私、合法合规。文理学院院长认为,教师对自己的课程拥有自主权,使用指南是基于尊重教师权利的原则。>>阅读原文

■ WPS AI正式面向社会开放
WPS AI正式面向社会开放,率先应用在WPS智能文档,更多WPS AI能力将在其他组件开放。用户可在最新版WPS客户端/APP、金山文档小程序/官网体验WPS智能文档。

9月4日·星期一

■ Civitai 举办的 SDXL 大奖赛获奖作品
分为角色lora、style、底模、绘画四个榜单,得奖作品效果确实非常好。 >>阅读原文

9月2日·星期六

■ Pika Labs引入了一个”-fps N” 的新参数
该参数允许用户自定义帧率。用户现在可以从 8 到 24 的范围内生成更流畅的视频。
同时还引入一个新命令:/animate。此命令需要附加图像。输入“/animate”后,将触发图像上传窗口,直接生成视频,可以不需要输入提示语,系统自我发挥生成视频。 >>介绍/教程/一键直达

■ 华为阿里等62家企业通过二批深度合成算法备案
网信办官网公开发布第二批境内深度合成服务算法备案信息。附件显示,第二批有阿里达摩院、华为、360奇虎等共62家企业、110个算法通过备案。 >>名单目录

9月1日·星期五

■ GPT-4发布剪映插件功能
震惊!GPT更新太快,现在GPT-4都已经用上剪映插件了,简单的口播视频已经可以一键出片,不用到处找素材,一行指令就自动生成,上字幕,旁白,BGM。想象一下,以后插件的素材库越来越完善时,视频的质量会越来越高,对于从业者来说效率提升不是一点点,以后拼的是后期技能加对AI工具的使用熟练度。 >>视频演示

8月31日·星期四

■ AI视频生成工具Runway发布新功能
Runway在Gen-2中发布了一项新功能:运动滑块
选择一个介于 1 到 10 之间的值以控制输出中的移动量。现已在浏览器中提供,即将在iOS上推出 >>视频演示

■ 近期ChatGPT频繁宕机
近期ChatGPT频繁宕机,OpenAI专门公开了一个可以看到每天ChatGPT运行情况的网页:http://status.openai.com

■ 好文共赏:《深度拆解天花板级复杂的提示词——什么可照搬什么不要学 》
推荐这篇《深度拆解天花板级复杂的提示词——什么可照搬什么不要学 》专业领域的 know how 比 prompt 技巧更重要,prompt 技巧能保证 AI 回复质量的下限,也能让使用 AI 的效率更高。但让 AI 回复的上限,除了模型本身的能力,就要靠提问者的 konw how 了 >>阅读原文

■ 国内8家获批上线的大模型 五家北京企业机构 三家上海企业机构
百度(文心一言)https://wenxin.baidu.com
抖音(云雀大模型)https://doubao.com
智谱AI(GLM大模型)https://chatglm.cn
中科院(紫东太初大模型)https://xihe.mindspore.cn
百川智能(百川大模型)https://baichuan-ai.com
商汤(日日新大模型)https://sensetime.com
MiniMax(ABAB大模型)https://api.minimax.chat
上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn
阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。

■ 好文共赏:《深度拆解天花板级复杂的提示词——什么可照搬什么不要学 》
推荐这篇《深度拆解天花板级复杂的提示词——什么可照搬什么不要学 》专业领域的 know how 比 prompt 技巧更重要,prompt 技巧能保证 AI 回复质量的下限,也能让使用 AI 的效率更高。但让 AI 回复的上限,除了模型本身的能力,就要靠提问者的 konw how 了 >>阅读原文

8月29日·星期三

■ 「特斯拉黑帮」全拆解,10 家公司,千亿美元,都在做什么?
好文共赏《特斯拉黑帮全拆解,10 家公司,千亿美元,都在做什么? 》
就像当年PayPal 黑帮一样,从特斯拉不断出走的高管,也逐渐形成了一个特斯拉黑帮!>>阅读原文

■ OpenAl 推出 ChatGPT 企业版
提供企业级安全和隐私保护,经认证符合 SOC 2 标准,客户的 Prompt 和公司数据不用于训练 OpenAI 模型,可以无限制访问 GPT-4,且无使用上限且速度还更快!>>阅读原文

8月28日·星期一

■ 利用人工智能代写学位论文等行为或被撤销学位证书
学位法草案今日已提请审议,草案对学位获得者盗用、冒用他人身份顶替他人取得的入学资格,利用人工智能代写学位论文,以及学位授予单位非法授予学位等行为,规定了相应的法律责任。

8月26日·星期六

■ 国内首例AI生成图片侵权案
原告李某某利用Stable Diffusion生成了一张人物图片,后将该图片以“春风送来了温柔”为名发布在某网络平台。被告刘某某在个人账号上使用该图片作为文章配图发布。李某某以侵害作品署名权和信息网络传播权为由将刘某某起诉到北京互联网法院。
在合议庭的组织下,双方当事人在庭审现场展开了激烈的辩论。涉案图片是否构成作品?如果构成作品,李某某是否享有对该图片的著作权?刘某某使用图片的行为是否侵犯了署名权和信息网络传播权?如果侵权成立,刘某某应当如何承担责任?
原告李某某认为,模型的选择、提示词及反向提示词的输入、生成参数的设置均可以体现出其独创性智力劳动,涉案图片具有独创性;被告刘某某未获得原告李某某的许可,截去了李某某在某网络平台的署名水印,使得相关用户误认为刘某某为该作品的作者,严重侵犯了李某某享有的署名权及信息网络传播权,应当赔偿李某某的经济损失并进行赔礼道歉以消除影响。
被告刘某某辩称,其所发布主要文章内容为原创诗文而非涉案图片,没有商业用途,不具有侵权故意;涉案图片是其通过网络检索获取的,具体来源已无法提供,使用时也不确定李某某是否对涉案图片享有权利。
目前,该案仍在进一步审理中。
原文:https://mp.weixin.qq.com/s/rdzctOfPu9zQaKO4ZVDCwQ

■ WavJourney 发布源码
WavJourney 是一个文字生成音频节目的模型,相比 elevenLabs 、Fliki 等文字生成人声的产品,WavJourney 的特点是不仅生成人声,同时生成了背景音乐、转场音乐、音频特效等用于氛围的音频,让一键创建播客有了可能。
HuggingFace演示:https://huggingface.co/spaces/Audio-AGI/WavJourney
Github:https://github.com/Audio-AGI/WavJourney
论文:https://arxiv.org/abs/2307.14335

8月25日·星期五

■ Hugging Face获D轮融资
由Google、Amazon、Nvidia、Salesforce和IBM领投。 Hugging Face 在 D 轮融资中筹集了 2.35 亿美元!
Hugging Face现在的总融资额达到了3.952亿美元,估值45亿美元。

■ 艾瑞咨询发布《2023年中国AIGC产业全景报告》
《2023年中国AIGC产业全景报告》展开对AIGC产业的全景洞察、探究生成式AI技术对数字产业的影响变化、绘制“中国AIGC产业全景图谱”、分析主流参与厂商类型与格局策略、各类型厂商发展路径和能力要求变化等。

■ Meta AI发布了一款专门用于编程的模型: Code Llama
Meta最近真是杀疯了,又出大招了!Meta AI发布了一款专门用于编程的模型: Code Llama
它能够根据自然语言提示和代码提示生成代码。Code Llama还可以解释代码的功能或结构。例如,如果你给它一个复杂的代码片段,它可以用普通语言解释大概代码是做什么的。

■ 微软宣布 Edge 浏览器已集成 Designer 功能
微软公司宣布,旗下的设计工具 Designer 已经成为 Edge 浏览器的一个完全集成的功能,用户在浏览器窗口中只需几次点击就可以创建出令人惊艳的视觉设计。在 Edge 中启用 Designer 功能后,用户在搜索栏中输入想要创建的内容,Designer 就会生成出色的视觉设计选项供用户选择,甚至包括使用 DALL-E 技术生成的独特图片。但目前该功能仅在美国市场上线。

8月24日·星期四

■ IP-Adapter:腾讯AI实验室开发的一款文本兼容图像提示适配器
可以使模型能够根据图像提示生成图像,而不仅仅是文本提示。与现有的图像提示适配器相比,IP-Adapter只有22M参数,相对较小,但性能与完全微调的图像提示模型相当甚至更好。IP-Adapter与现有的可控生成工具兼容,例如ControlNet和T2I-Adapter。实现更加灵活和多样化的图像生成。
项目地址:https://ip-adapter.github.io
论文:https://arxiv.org/abs/2308.06721

■ 英伟达H100 AI处理器爆卖
据英国《金融时报》报道,英伟达H100 AI 处理器2024 年的所有产量都已经卖光了。英伟达将H100 的2024产量增加了两到三倍,达到 150 万至 200 万个,比今年期的 50 万个大幅跃升尽管计划增加产量,但市场对这些处理器的需求仍然超过了供应。

■ GPT-3.5 Turbo新功能: OpenAI推出微调功能,让GPT-3.5 Turbo在特定任务上与GPT-4匹敌或超
越。

GPT-3.5 API的微调:OpenAI现在允许开发者对GPT-3.5 API进行微调,这意味着开发者可以使用自己的数据来定制模型,使其更适合特定的应用或风格。
使用问答对进行微调:开发者可以通过提供一系列的问答对来进行微调,这样可以训练出具有特定功能或风格的模型。
Prompt的优化:OpenAI提供了一种方法,可以将Prompt嵌入到模型中,从而减少Prompt的长度和占用。这可以优化最多90%的Prompt占用,从而节省API调用的成本。
API价格的变化:与微调功能的推出相伴随的是API价格的增加。微调后的模型使用费用是原来的9倍,但仍然比GPT-4的价格便宜。
吴恩达最新的《微调大语言模型》短课程上线了,课程内容包括了: 了解何时对LLM应用微调、准备数据以进行微调、根据你自己的数据训练和评估LLM。

■ Meta 发布 SeamlessM4T AI 模型
支持近100种语言的自动语音识别、语音到文本翻译等。其目标是创建一个类似《银河系漫游指南》中的虚构的巴别鱼的通用语言翻译器。
在线演示:https://seamless.metademolab.com
HuggingFace演示:https://huggingface.co/spaces/facebook/seamless_m4t

■ 朱雀仿宋:首款开源的仿宋字体
灵感来自民国时期的仿宋活字“南宋”,并以此为蓝本,目前发布的“朱雀仿宋”仍为预览测试版。允许免费商用、复制与再分发。
Github地址:https://github.com/TrionesType/zhuque

相关文章