微软开发的影片生成模型DragNUWA最近开源了,包括1.0和1.5版本,可结合文字、图片和轨迹,来更细致地将图片转为影片。
微软
重点新闻(0105~01011)
影片生成 微软 DragNUWA
微软开源可控性更细致的影片生成模型DragNUWA 1.5
去年8月,微软团队发表影片生成模型DragNUWA论文,近来,他们不只 Mobile ALOHA 机器人 史丹佛大学
可灵活模仿人类双手动作!史丹佛大学发表机器人系统Mobile ALOHA
最近,史丹佛大学开发一款能灵活模仿人类双手动作的机器人系统Mobile ALOHA,可执行移动式的操纵和控制任务,比如炒虾、擦拭酒渍、靠椅子和人击掌等。团队指出,目前模仿人类动作的机器人,大多是在固定位置上动作,难以移动位置执行更灵活的任务。
为解决问题,团队打造了低成本、全身远距操控系统Mobile ALOHA,搭配可移动的底座和资料收集能力,来让机器人执行移动式的操纵任务。这套系统采用监督式行为复制学习方法(Supervised behavior cloning),也就是利用机器人收集到的资料,再加上ALOHA既有的静态资料集,能强化机器人移动操作任务的表现。
特别是,每个任务经过50次示范,再加上既有资料集共同训练,可提高系统的成功率到90%,让ALOHA能自主完成复杂的移动式操作任务,例如炒虾、打开2扇门的橱柜并摆放锅具、按电梯和进电梯,以及开水龙头冲洗用过的平底锅等。
晶创台湾 跨部会 生成式AI
晶创台湾方案正式启动,国科会揭4大布局
行政院在去年11月通过晶创台湾方案,要在2024年至2033年间投入3,000亿元,来结合半导体晶片和生成式AI、发展各产业的创新应用。就在本月11日,行政院政委暨国科会主委吴政忠展开晶创台湾方案启动会议,找来国科会、经济部、教育部、卫福部、数发部、农业部、国发会等部会共同启动晶创台湾方案。
在这场启动会议中,各部会提出4大推动方向,首先是国科会、经济部、数位部、卫福部、农业部等将共同推动生成式AI+晶片应用,来加速各行业创新。他们去年开始调查百工百业的AI需求,并以机械业为示范,建立资料共享机制,接下来要扩大延续各行业创新。今年,国科会还要建置算力、精进大型语言模型(LLM),强化台湾生成式AI服务。
再来,国科会、教育部、经济部将共同强化国内半导体培育环境,来吸引全球研发人才。他们要在今年成立第一个晶片设计海外基地,并规画先进IC设计训练教材、建置产学研共享的半导体研究设备平台。第三,国科会要与经济部推动异质整合和先进技术研发,如7nm先进晶片、AI、HPC、车电通讯等领域,今年还要研发IC设计工具的关键技术自主,并建置自动化IC设计云平台。最后,国科会要与国发会共同培育国内新创、吸引国内外新创和投资来台,今年要完成涵盖IC设计、晶片下线、测试到最后雏型产品试制的一站式pipeline,来降低国内外新创投入门槛。 GPT Store ChatGPT 客制化
OpenAI GPT Store正式上线
继先前预告,OpenAI终于在10日宣布客制化Chatbot分享与销售平台GPT Store正式上线,预计第一季内从美国开始推行GPTs共享回馈方案。OpenAI在去年11月初揭露GPTs服务,是一个可客制化ChatGPT的服务,同时也揭露GPT Store,也就是可分享、销售客制化ChatGPT聊天机器人的商店平台,目前已累积300多万个客制化ChatGPT版本,也有不少人分享到之前尚未正式推出的GPT Store上。
现在,GPT Store正式开放,首先会给ChatGPT Team方案用户,使用尚未公开的GPTs,接下来则会开放给ChatGPT Enterprise用户。Team和Enterprise版都会提供GPTs管理控制功能,像是决定内部GPTs怎么分享,或哪些外部GPTs可用于企业内。GPT Store还将列出GPTs精选,以及DALL-E、写作、生产力、研究&分析、程式撰写、教学和生活等类别,并提供搜寻工具,供用户自行搜寻。 AI发展 AI Impacts 假讯息
全球近3千名专家调查:AI发展快于预期
AI Impacts组织对全球近3,000名AI专家进行问卷调查,结果发现,这群专家认为AI的进步超越了先前预测。进一步来说,这场调查对象为去年在6个顶尖AI学术研讨会上,发表研究报告的2,778名AI专家。虽然大多数专家对AI进步带来的长期价值仍有不确定性,如68.3%的受访者认为,超人AI将带来正面结果,但其中48%亦同意有5%的机率可能会造成人类灭绝等极糟结果。另一方面,有26.9%赞成维持现阶段的AI发展速度,才能造福人类,另有38.4%认为应加快发展脚步、34.7%认为应放慢脚步。
不论如何,目前AI的进步已超出预期,原本预计要更久后才能达到的目标,都可望在2028年之前提前达标,像是提供规范与范例就能创造简单的Python程式码、撰写一篇高品质的高中历史作文,或帮新物件分类、替既有的创作者创作假新歌、自动建立一个支付网站,或提供电话银行服务等。
此外,先前估计自动寻找及修补安全漏洞的能力也得等到2043年,最新的预测则会在2033年以前完成。不过,这群AI专家在未来30年最担心的问题,则以假讯息居冠,包括以AI来创作和散布假讯息,或是用来操纵大众意见趋势等,另也担心AI系统会加剧经济上的不平等。图片来源/微软、史丹佛大学、Google DeepMind、AI Impacts、Google
AI近期新闻