SAS揭露3大创新实验方向

SAS力推数位双生,来将建筑、企业组织等实体资产数位化,使用者则可运用SAS平台的智能助理下指令,来模拟可能的变化或预测。(图片来源/SAS)

生成式AI应用已成各科技大厂技术年会的标配,除了它,还有哪些技术能让人耳目一新?

转型为AI工具供应商的老牌数据分析大厂SAS在今年度Innovate 2024大会上,不意外地力拥生成式AI,发表智能开发助理、合成资料产生器、AI应用开发工具和更多生成式AI功能,同时也扩展AI监管工具和治理顾问服务,来巩固AI产品线。

但在年会最后一天,他们揭露创新实验室发展亮点,瞄准未来趋势,包括数位双生、实体整合(Entity resolution)和量子运算等3大主轴。

其中,数位双生就像是企业的分身,可透过数位方式预测特定情境下的运行变化,实体整合则指将零散、有缺失的资料归户到同一个实体,量子运算则可用来加速原本耗时的复杂运算,如肾脏移植匹配。

创新亮点1:数位双生

数位双生并非第一次出现在SAS年会上。2023年,SAS技术长Bryan Harris在该年年会上就强调数位双生,透过建置企业的数位身分,包括组织人事、营运细节、进销货、物流等关键数据,就能用来模拟「假如……会怎样?」的情境,尤其是企业业务中断的模拟,或供应链发生问题时的冲击预测,来加速企业的反应能力。

今年,SAS执行长办公室执行副总裁Gavin Day延续这个主轴,进一步说明,数位双生是将实体资产虚拟化模拟的作法,如建筑、人、组织等,可用来模拟、预测特定条件下的可能变化。现场以一家大型零售厂商为例,该厂使用者可在SAS平台仪表板上,检视物流、供应链和整体表现数据。甚至,SAS本次揭露的Viya Copilot智能助理,还整合数位双生,能在平台上自动提示使用者营收和生产变化,比如根据最新资讯预测,整体营收可达到89万美金,但某项产品可能无法达到预期生产量,并给出具体的缺失数量。接著,使用者可询问这个缺失何时会发生,助理就会给出详细月份,供企业预先准备。

另一方面,使用者也能透过智能助理,来询问、模拟不同决策的可能状况,比如决策者接受公司讯息通知,分部工厂将关厂30天,此时就能询问智能助理,关厂30天可能带来的收益和服务冲击。又或是,这个关厂对某项产品的买一送一促销活动,有何影响。

在这些问题背后,系统会进行一连串模拟运算,并在给出智能助理文字回答的同时,也会在平台仪表板上,显示各项指标的预测数字,如获利、营收、服务水准和生产单位等。

创新亮点2:实体整合

实体整合(Entity resolution)是指将来自不同系统的资料,整合、归户到同一实体上,比如将州政府各个系统的人物资料,汇整为完整的单一档案。(图片来源/SAS)

另一创新重点是实体整合,这是一种将来自不同系统的分散资讯,归户到同一个实体(Entity)的作法,又可称为数据匹配。Gavin Day指出,实体整合很重要,不只能获得一个完整的实体数据,对AI开发来说,更能达到资料清理的效用。因为透过数据匹配、将零散的资料归户清理干净,就能降低「Garbage in,garbage out」的窘境。

SAS资深资料科学家Charles Cavalier现场举例,实体整合可用于资料归户,比如美国各个州政府系统中,有著各式各样的民众资料,如教育资料、驾照、医疗资料、税收资料等,同一位民众在不同系统的资料,可能以不同姓名写法呈现(如缩写),或可能缺失某些重要资讯(如电话中间码、车牌号码等)。但透过深度学习等方法,从不同系统中、众多类似人名的资料里,正确归纳出特定个人的完整资讯,这就是实体整合。实体整合使用到的技术,则包括机器学习、深度学习和图类神经网路等,Charles Cavalier强调,原本在单一类别或系统中缺失的资料(如电话、教育程度等),甚至能因实体整合而补足。

在实际应用上,就有国家政府机关,使用SAS Viya平台和实体整合功能,来进行网路分析,进一步揪出税务诈欺模式,他们也因此补足了60亿笔税务纪录,也因抓出逃漏税、获得了额外的6.35亿美元税收。

至于实体整合的下一步,Charles Cavalier透露,SAS AI建模团队打算建置Transformer小型语言模型,作为基础模型,接著对模型做实体整合任务微调,来让模型学会实体分类,进一步提高实体整合的能力。他也表示,团队目前正研究生成式资料处理技术和深度嵌入,搭配这些技术,就能用来在不同资料集中找出同一个实体的描述纪录,就像是资料归户,另也能用于搜寻任务。之后,SAS计划将这些能力整合到既有产品中。

创新亮点3:量子运算

最后一项创新主轴是量子运算。早在年会开幕式上,Bryan Harris就揭露量子运算将是接下来SAS创新实验室的重点发展,而且,「我们实验发现,透过结合量子运算和传统运算的混合运算架构,能大幅改善运算结果。」他也表示,量子运算在未来1、2年的发展,就会像是生成式AI之于AI一样,带来翻天覆地的变化。

而SAS应用AI暨建模部门总监Jinxin Yi现场以肾脏捐赠配对为例,来说明量子运算加速后的运算结果。

他表示,就肾脏移植配对来说,通常三分之一的捐赠者和受赠者无法第一次就配对成功。为解决这个问题,常见的做法是使用图学,用点来代表捐赠者,以边(点与点之间的直线距离)代表捐赠者与受赠者的匹配程度,并从这些点与边形成的网路中,找出最合适的肾脏移植配对候选组,这个候选组可由好几个点(即捐赠者与受赠者)组成。SAS团队就采这种方法来计算。

但这种方法,这需要大量且复杂的运算,就算是用SAS本身优化过的运算方法,也得要180秒才能得出99.4%的最佳解。但使用SAS打造的量子解算器,30秒就能找出100%的最佳解。

SAS创新实验室力推量子运算,以肾脏移植为例,为找出最合适的移植配对组,用量子解算器加速后,取得最佳解的时间可缩短为30秒。(图片来源/SAS)

 更多相关报导请见