Inflection释出可比美GPT-4的Inflection-2.5模型,已部署于Pi聊天机器人

Inflection指出,在MMLU、GPQA Dimond、Big-Bench-Hard、Mathematics等基准评测上,新一代Inflection-2.5模型表现都接近GPT-4。(图片来源/Inflection)

于2022年创立的AI公司Inflection周四(3/6)发表了新一代的大型语言模型Inflection-2.5,指出在许多的基准测试中,该模型已可比美OpenAI的GPT-4及Google Gemini,此外,Inflection-2.5也已被部署在Pi聊天机器人中。

Inflection执行长暨共同创办人的Mustafa Suleyman为AI领域的研究先驱,他在2010年即共同创办了DeepMind,在Google于2014年买下DeepMind之后,亦转至Google负责DeepMind。Inflection另一名创办人则是科技产业的创业家Reid Hoffman,曾共同创办已被微软收购的LinkedIn。

现阶段Inflection的主要产品为去年5月发表的Pi聊天机器人,Pi定位为个人AI,可充当使用者的教练、知己、创意合作伙伴或是倾诉的对象,Pi具备高情商,强调友善、支持、好奇、谦虚 、创意及有趣,已支援桌面、浏览器、Android及iOS等平台,也可直接将它嵌入WhatsApp、Instagram与Facebook中,但目前仅有英文、西班牙文、法文、德文、义大利文及葡萄牙文,尚未提供中文服务。

新的Inflection-2.5模型不管是在MMLU、GPQA Dimond、Big-Bench-Hard、Mathematics、Coding或Common Sense等基准评测上都接近GPT-4模型。平均而言,在各种IQ导向的AI任务中,Inflection-2.5的平均表现已达到GPT-4的94%,但进行训练所使用的运算量,却只有GPT-4的40%。

Suleyman表示,现在Inflection将把IQ加入Pi卓越的EQ中。

Pi聊天机器现在每天已有100万活跃用户,每月活跃用户则是600万,自去年5月以来,使用者与Pi交换的讯息已超过40亿则。根据Inflection的统计,使用者每天与Pi的对话平均持续33分钟,更有1/10的对话超过1小时,每一周与Pi交谈的使用者中,有60%会在隔周重返Pi,其每月的使用者黏性高过竞争对手。