AI趨勢周報第239期：微軟終於開源影片生成模型DragNUWA 1.5了

微软开发的影片生成模型DragNUWA最近开源了，包括1.0和1.5版本，可结合文字、图片和轨迹，来更细致地将图片转为影片。

图片来源:

微软

重点新闻(0105～01011)

影片生成 微软 DragNUWA

微软开源可控性更细致的影片生成模型DragNUWA 1.5

去年8月，微软团队发表影片生成模型DragNUWA论文，近来，他们不只 Mobile ALOHA 机器人 史丹佛大学

可灵活模仿人类双手动作！史丹佛大学发表机器人系统Mobile ALOHA

最近，史丹佛大学开发一款能灵活模仿人类双手动作的机器人系统Mobile ALOHA，可执行移动式的操纵和控制任务，比如炒虾、擦拭酒渍、靠椅子和人击掌等。团队指出，目前模仿人类动作的机器人，大多是在固定位置上动作，难以移动位置执行更灵活的任务。

为解决问题，团队打造了低成本、全身远距操控系统Mobile ALOHA，搭配可移动的底座和资料收集能力，来让机器人执行移动式的操纵任务。这套系统采用监督式行为复制学习方法（Supervised behavior cloning），也就是利用机器人收集到的资料，再加上ALOHA既有的静态资料集，能强化机器人移动操作任务的表现。

特别是，每个任务经过50次示范，再加上既有资料集共同训练，可提高系统的成功率到90%，让ALOHA能自主完成复杂的移动式操作任务，例如炒虾、打开2扇门的橱柜并摆放锅具、按电梯和进电梯，以及开水龙头冲洗用过的平底锅等。

晶创台湾 跨部会 生成式AI

晶创台湾方案正式启动，国科会揭4大布局

行政院在去年11月通过晶创台湾方案，要在2024年至2033年间投入3,000亿元，来结合半导体晶片和生成式AI、发展各产业的创新应用。就在本月11日，行政院政委暨国科会主委吴政忠展开晶创台湾方案启动会议，找来国科会、经济部、教育部、卫福部、数发部、农业部、国发会等部会共同启动晶创台湾方案。

在这场启动会议中，各部会提出4大推动方向，首先是国科会、经济部、数位部、卫福部、农业部等将共同推动生成式AI+晶片应用，来加速各行业创新。他们去年开始调查百工百业的AI需求，并以机械业为示范，建立资料共享机制，接下来要扩大延续各行业创新。今年，国科会还要建置算力、精进大型语言模型（LLM），强化台湾生成式AI服务。

再来，国科会、教育部、经济部将共同强化国内半导体培育环境，来吸引全球研发人才。他们要在今年成立第一个晶片设计海外基地，并规画先进IC设计训练教材、建置产学研共享的半导体研究设备平台。第三，国科会要与经济部推动异质整合和先进技术研发，如7nm先进晶片、AI、HPC、车电通讯等领域，今年还要研发IC设计工具的关键技术自主，并建置自动化IC设计云平台。最后，国科会要与国发会共同培育国内新创、吸引国内外新创和投资来台，今年要完成涵盖IC设计、晶片下线、测试到最后雏型产品试制的一站式pipeline，来降低国内外新创投入门槛。 GPT Store ChatGPT 客制化

OpenAI GPT Store正式上线

继先前预告，OpenAI终于在10日宣布客制化Chatbot分享与销售平台GPT Store正式上线，预计第一季内从美国开始推行GPTs共享回馈方案。OpenAI在去年11月初揭露GPTs服务，是一个可客制化ChatGPT的服务，同时也揭露GPT Store，也就是可分享、销售客制化ChatGPT聊天机器人的商店平台，目前已累积300多万个客制化ChatGPT版本，也有不少人分享到之前尚未正式推出的GPT Store上。

现在，GPT Store正式开放，首先会给ChatGPT Team方案用户，使用尚未公开的GPTs，接下来则会开放给ChatGPT Enterprise用户。Team和Enterprise版都会提供GPTs管理控制功能，像是决定内部GPTs怎么分享，或哪些外部GPTs可用于企业内。GPT Store还将列出GPTs精选，以及DALL-E、写作、生产力、研究&分析、程式撰写、教学和生活等类别，并提供搜寻工具，供用户自行搜寻。 AI发展 AI Impacts 假讯息

全球近3千名专家调查：AI发展快于预期

AI Impacts组织对全球近3,000名AI专家进行问卷调查，结果发现，这群专家认为AI的进步超越了先前预测。进一步来说，这场调查对象为去年在6个顶尖AI学术研讨会上，发表研究报告的2,778名AI专家。虽然大多数专家对AI进步带来的长期价值仍有不确定性，如68.3%的受访者认为，超人AI将带来正面结果，但其中48%亦同意有5%的机率可能会造成人类灭绝等极糟结果。另一方面，有26.9%赞成维持现阶段的AI发展速度，才能造福人类，另有38.4%认为应加快发展脚步、34.7%认为应放慢脚步。

不论如何，目前AI的进步已超出预期，原本预计要更久后才能达到的目标，都可望在2028年之前提前达标，像是提供规范与范例就能创造简单的Python程式码、撰写一篇高品质的高中历史作文，或帮新物件分类、替既有的创作者创作假新歌、自动建立一个支付网站，或提供电话银行服务等。

此外，先前估计自动寻找及修补安全漏洞的能力也得等到2043年，最新的预测则会在2033年以前完成。不过，这群AI专家在未来30年最担心的问题，则以假讯息居冠，包括以AI来创作和散布假讯息，或是用来操纵大众意见趋势等，另也担心AI系统会加剧经济上的不平等。图片来源／微软、史丹佛大学、Google DeepMind、AI Impacts、Google

AI近期新闻

1. 3. 摩根大通JPMorgan释出专家混合架构（MoE）模型

AI趋势周报第239期：微软终于开源影片生成模型DragNUWA 1.5了