地址: 深圳湾科技生态园5栋D座1302室
客服电话: 4008400488
邮箱: bd@rainxn.com
墨客星球
友情链接
© 2019 深圳雨本信息技术有限公司 | 粤ICP备17123203号 | 网站建设:中企动力 深圳
联系我们
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购;Meta新模型Humpback击败现有全部LLaMa模型
热点速递2023-08-17
OpenAI收购数字产品公司Global Illumination,为创立以来首笔公开收购
北京时间周四凌晨,OpenAI在官网发布公告,宣布收购初创企业Global Illumination并将整个团队纳入麾下,新成员们已经开始参与包括ChatGPT在内的核心产品开发。这笔交易也是OpenAI自2015年创立以来,第一次公开收购,具体的交易条款并没有公开。
对于Global Illumination而言,这家公司最近的项目,是一个叫Biomes的开源大型多人在线沙盒游戏,依托于网页浏览器运行。从网站上放出的先导片预告来看,风格类似于全球历史销量排名第一的游戏《我的世界》。目前并不清楚收购完成后,这个游戏到底还会不会继续做下去。(财联社)
苹果新获一项专利,有意将这一技术用于Mac产品线
据行业媒体报道,苹果新获得专利,名为“用于确定计算设备用户的光识别模块”,主要关注点是将Face ID引入MacBook等产品,将用于笔记本电脑、桌面电脑等产品。
面容识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术。根据数据,我国面容识别市场规模达45亿元,随着市场渗透率持续提高,下游应用持续增长,中经产业预计到2024年我国人脸识别市场规模将突破100亿元,四年年均复合增速达23.3%。
阿里达摩院发布癌症分析通用模型
阿里达摩院今日发布多癌影像分析通用模型,可检测、分割和诊断八种主要的高发致死癌症,据称有助于实现多癌统一诊断,降低漏诊概率。
针对市面上医疗AI模型出现的高假阳性、漏检等问题,达摩院医疗AI团队联合中山大学肿瘤防治中心、四川省肿瘤医院、浙大附属第一医院、盛京医院、广东省人民医院等单位,提出了一个统一的多癌影像分析通用模型(cancerUniT),以Mask Transformer语义分割为基础,解决多种肿瘤图像此前难以统一检测、分割和诊断的问题,适用于八种主流的高发高致死癌症(肺、结直肠、肝、胃、乳腺、食管、胰腺、肾)以及相关器官中的肿瘤子类型。
根据官方数据,在一组631名患者的对比测试中,该模型肿瘤检测、分割和诊断任务的性能均优于8个特定器官的单模型组合,检测任务的平均敏感性达到93%,平均特异性达到82%。
AR、VR·元宇宙
微软专利提出低延迟的VR/MR VST透视计算系统
苹果Vision Pro,Meta Quest 3,PICO 4,视频透视功能越发成为XR头显的标配。实际上,微软同样有探索这一主题。在名为“Video pass-through computing system”的专利申请中,微软就介绍了一种视频透视计算系统。这是一种低延迟视频透视计算系统,可以直接在硬件中,在子帧级执行摄像头图像像素流的图像信号处理。这种处理可由头戴式显示设备的AR控制电路执行,以便产生处理过的图像像素流。在一个实施例中,摄像头图像像素流的图像信号处理可以直接在头戴式显示器的硬件中执行,这可以减少传输开销,从而进一步减少延迟。延迟可以降低到用户的认知阈值以下,例如约10毫秒,这样用户就不会在显示的AR图像像素流中感知到任何延迟。另外,通过使用来自摄像头图像像素流和虚拟图像像素流的合成像素的反馈来控制摄像头启动图像捕获的时间,可以适当地临时注册摄像头像素图像流和虚拟图像像素流。通过这种方式,可以向用户显示没有失真和不适的AR体验。
英伟达为远程会议通话研发AI 3D视频聊天解决方案
3D视频会议的最新发展已经呈现出捕获眼神交流和其他非语言线索的潜力,但现有系统需要昂贵的3D采集设置。所以在一个名为“AI-Mediated 3D Video Conferencing”的项目中,英伟达以及高校研究人员通过AI人工智能的方法实现了一种高保真低成本的3D远程呈现方法,并且提供了基于3D扫描的方法所无法提供的新功能。另外,团队提出的解决方案支持多种现成的3D显示器,包括立体显示器和光场显示器。需要注意的是,团队使用NVIDIA TensorRT优化了编码器的性能,并在NVIDIA A6000 Ada Generation GPU进行实时推理。系统管道端到端的运行时间不到100毫秒,包括捕获、流式传输和渲染。
新能源汽车
华为申请注册“LUXEED”“智界”商标
据爱企查App显示,近日,华为技术有限公司申请注册多个“LUXEED”“智界”商标,国际分类涉及皮革皮具、啤酒饮料、手工器械、方便食品、科学仪器等,当前商标状态均为注册申请中。据媒体报道,近日,在最新一批次的工信部新车申报名录中,由华为与奇瑞联合打造的LUXEED首车亮相,其定名为“智界S7”,该车是华为智选车旗下首款纯电轿跑,将率先搭载鸿蒙4系统,并在三季度完成亮相。(36氪)
蔚来座舱高级总监朱永盛已离职,曾任阿里AliOS智能交通负责人
近日,蔚来座舱高级总监、原阿里AliOS智能交通负责人朱永盛已于今年6月离职。朱永盛在阿里期间的职级最高到P9。从阿里来到蔚来后,朱永盛挂的title是数字座舱总架构师&资深专家,向座舱副总裁张磊汇报(张磊的汇报对象则是董事长李斌),但朱永盛在蔚来的时间仅1年4个月。
蔚来自动驾驶也有一些变动。蔚来自动驾驶由副总裁任少卿负责,自动驾驶汽车软件构架通常包括感知模块、定位模块、规划模块和控制模块。自动驾驶感知部分的负责人是彭超,是任少卿在Momenta的老部下。数月前,彭超手下的静态感知负责人翟玉强已离职。值得注意的是,有业内人士向雷峰网透露,“蔚小理中有一个负责智能座舱的一线中高层人员即将要出来创业(还未离职),创业方向是将多模态大模型用于智能座舱。”(雷峰网)
AI·人工智能
OpenAI宣布将GPT-4引入内容审核系统,减少人工参与
当地时间8月15日,人工智能初创公司OpenAI在官网宣布其将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。OpenAI表示,使用GPT-4的内容审核系统能更快地迭代策略变更,将周期从数月缩短到数小时。任何拥有OpenAI API访问权限的人都可以采用这种方法创建自己的人工智能辅助审核系统。(界面新闻)
Meta推出新模型,Humpback击败现有全部LLaMa模型
Meta AI研究人员于8月14日发表论文,提出了一种可扩展的方法即指令回译(instruction backtranslation),通过自动注释相应的指令来构建高质量的指令跟随语言模型。
该研究主要针对LLM(大型语言模型)对齐自动化以提升数据质量,通过对Llama进行微调,其产生的模型Humpback在Alpaca排行榜上优于其他现有的非蒸馏模型,如LIMA、Claude、Guanaco等。该模型的名字Humpback意思为座头鲸,又名驼背鲸,论文表示如此命名是因为是与驼峰有关,但规模量级却如同鲸鱼。
谷歌百人“复仇者联盟”出击,将发对标GPT-4的大模型,26位研发主管名单流出
据外媒报道,谷歌于4月新合并的AI SWAT团队正在为秋季大型发布会做准备,将发布代号为Gemini的大模型,反击OpenAI的GPT-4。多位开发人员爆料了Gemini的跨模态文本生成图像能力,及图表分析、文字或语音指令等多种功能,并称其有望为聊天机器人Bard等其他业务提供动力,从而与GPT-4的系列应用形成对垒。
该团队中的小组分工及各小组主管,如表格所示,来自两个团队的26位主管的信息被搜集梳理了出来。(智东西)
魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话
阿里云推出数字人视频生成工具Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。据介绍,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。(36氪)
腾讯云MaaS最新升级:上架20多个主流模型,支持开发者一键调用
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在2023中国数字经济创新发展大会上宣布了腾讯云MaaS最新升级。腾讯云TI平台已经全面接入Llama 2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多个主流模型,且支持系列模型的直接部署调用、应用流程简单、可全程低代码操作,成为国内第一批上架和支持开源模型的大模型厂商。(36氪)
钉钉个人版开放内测:没有打卡已读功能
钉钉个人版正式启动内测,所有人可在钉钉官网申请加入测试。申请通过后,用户可抢先体验各类AI服务,目前文生文、文生图、角色化对话以及AI创作等服务均限时免费。钉钉个人版没有已读没有打卡等功能,内测版本仅有空间、AI、云盘、会议4项功能,产品将以AI为核心,用户可一站获取类似ChatGPT、Midjourney、Notion AI等各类大模型能力。(新浪)
NO.1
微信号|AIR-ZHS
为行业人提供有价值的产业内容