作者:admin 发布时间:2022-12-20 18:45:12 分类:科技 浏览:218 评论:0
关于Siri
Siri在苹果的官方宣传中是个“智能个人语音助理”,可令iPhone4S及以上手机(iPad 3以上平板)变身为一台智能化机器人,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。
具体的使用场景是这样的:你对着iPhone说一句话,“旧金山剧院附近的意大利餐馆”,Siri会做语音识别和自然语言理解,迅速查一些数据库,然后回答“离你不远哦,最近的一家走路十分钟”,并附上具体的地址、地图展示给你。再比如,你在开车时,对它说: “告诉我老婆我要迟到十分钟”,它会在通讯录里找到你的妻子,并发送这条消息给她。
Siri能够支持自然语言输入,并且可调用系统自带的天气预报、日程安排、搜索资料等应用,还可不断学习新的声音和语调,提供对话式的应答。换句话说:Siri是智能增强(IA)而不是人工智能(AI)。
什么是人工智能
那么问题来了,什么是人工智能呢?人工智能有分为哪些方向呢?
人工智能(Artificial Intelligence,缩写AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。AI是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
AI是对人的意识、思维的信息过程的模拟,AI从诞生以来,理论和技术日益成熟,应用领域也不断扩大。AI不是人的智能,但能像人那样思考、也可能超过人的智能,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
人工智能分类
通过跟踪分析了横跨63个国家被分为13个品类的超过910家企业,AI可划为13个细分领域:
随着AI的持续发展,其连带市场也将迅猛崛起,下图对AI各品类的成熟度进行了总结划分。“语音识别”及“视频内容识别”类以8年“高龄”并登冠军宝座,而“计算机视觉(通用)以6.5年屈居第二。
下面我们就一一介绍下各个领域:
【机器学习·App】
深度学习/机器学习·App:机器学习是计算机基于其提取现有数据运行计算程序的一种技术。深度学习是集中于深层神经网络的机器学习的一个分支。下面的公司使用深度学习/机器学习App技术作为一个核心产品或者将其纳入到他们的一些产品或应用里。
InsideSales 公司为企业销售提供基于大数据分析的用户购买行为预测。公司产品有“连续学习”的算法层,将海量的交互数据与外部资源数据导入InsideSales的平台中进行分析。
Arago成立于1995年,是德国一家企业智能IT系统/软件开发商,公司基于AI和机器学习的基础上开发的AI软件AutoPilot可以让企业自动化完成完整的IT架构,从而取代了企业的IT人员的部分工作。
【自然语言处理】
自然语言处理:计算机通过自然语言处理方法处理人类语言输入,将其转化为可理解的数据表示并从中获取信息意义。
SwiftKey 2016年2月4日微软2.5亿美元收购了这家智能手机可预测AI键盘开发商Swiftkey。Swiftkey曾是世界最流行的智能手机App之一。完成收购后,微软将召集其全球150名员工加入到MicrosoftResearch部门。
Synapsify,非结构化文本的观点提取,构建了能在语义上阅读和学习类似人类书写内容的App。
【计算机视觉·通用】
计算机视觉/图像识别:计算机视觉是对图像进行处理和分析并从中理解、提取信息的方法。图像识别是扫描图像并识别物体或面孔的程序。
MetaMind是一家14年成立的创业公司。旨在打造一个用于自然语言处理、图像理解和知识基础的分析的AI平台,其领域包括但不限于用于医疗成像、食物识别、客服服务和解决方案等定制产品。
Clarifai是以视觉为基础的搜索,与传统基于文本的图片搜索不同的是,Clarifai利用模型训练将照片的内容提取出来。Clarifai的技术中枢是高性能深度学习API,可以构建新的智能App。
轻搜科技是一家做图像识别和搜索的引擎中国技术公司。公司专注于服装识别,人体识别,文字识别,商品识别等一系列的图像识别技术,并以最简单易用的云服务方式将最好的图像识别技术提供给广大开发者和企业级用户。
在智能化设备和应用迅速普及的今天,图像识别将成为一枚钥匙,打开科技与万物互联的那道门。轻搜saas平台真诚为有需要的人提供以图搜图的服务,最快只需9分钟即可让客户完成远程接入。
【机器识别·通用】
深度学习/机器学习应用(通用):机器学习是计算机基于其提取现有数据运行计算程序的一种技术。深度学习是集中于深层神经网络机器学习的一个分支。
BigMl是一个高可用性、低延迟的机器学习系统,你可以直接上传你的数据或通过API连接到云数据(例如Google Drive或Google Cloud)实现结构化数据,建立模型,最后做出预测。
【计算机视觉·App】
计算机视觉/图像识别:计算机视觉是对图像进行处理和分析并从中理解、提取信息的方法。图像识别是扫描图像并识别物体或面孔的程序。
Slyce公司做的是智能识物的技术,让顾客拍照或扫描物品就可以被引导至零售商的网上商城里买东西,并将这项技术提供给大型品牌网站。
Flyby是一家现实增强AR公司。曾帮助谷歌在“Project Tango”项目中开发出了第一款利用图片识别技术的面向消费者的App。Flyby Media 团队的技术涉及大规模 SLAM、室内导航、传感器融合、图像识别和 3D 跟踪等领域。
【虚拟个人助理】
虚拟个人助理:虚拟个人助理即软件代理商使用人工智能技术为个人提供服务和执行任务,诸如客户服务等。
Vlingo是一家“不需语法”的语音识别技术公司。Vlingo的私人助理比苹果公司的Siri早5年。在Nuance与苹果语音识别之战中,Nuance以不公开的价格收购了Vlingo。(那篇“Siri,你是被Nuance驱动的么?Siri:对不起,我拒绝回答”增霸占各种媒体头条)
【语音识别技术】
自然语言处理(语音识别):语音识别是自然语言处理的一个分支,其侧重于处理人类语音的声音剪辑及分析提取语音派生的含义。
Expect Labs
Expect Labs 公司的软件可以“偷听”用户之间的对话,然后根据对话内容提供相关信息。公司产品MindMeld App程序现在可以在 8 人会话中找出关键信息,并且为说话人提供有用的信息。
【智能机器人】
智能机器人:智能机器人公司创造出可以通过他们的行为和经验学习并且可根据其周围环境情况作出相应反应的机器人。
Jibo公司做的是社会型机器人,它可以识别脸部、理解人们说的话,并以可爱的声音做出反应。
另外行业解决方案智能创业公司机器人主要是专注某个特定的垂直领域。
【情景感知计算】
情境感知计算:计算机通过情境感知计算程序可以感知到所处环境及其应用情景,像地理位置,方向,光照强度等,并相应地调整自身行为反应。
Grokr是一款iPhone专用的预测软件。能够以很高的准确率预测用户的族裔、性别和年龄,预测出你可能会去的地方。
【视频内容识别】
视频内容自动识别:计算机通过视频内容自动识别程序将采样视频内容与源内容文件进行比对,通过视频特征以分析确认视频内容。
Enswers是一家做自动视频内容识别的韩国创业公司。11年被Korea Telecom收购,是三星的合作伙伴。与Cognitive Network一样,他们都是通过识别视频内容投放广告来完成与用户的交互,但他们有自己的SDK工具,应用场景更广泛。
【手势控制】
手势控制:人们通过手势控制程序与计算机进行交流互动,并由计算机识别并诠释。
手势控制:人们通过手势控制程序与计算机进行交流互动,并由计算机识别并诠释。
Gesturetalk是一家硬件软件同时发展的公司,成立于1986年。公司的手势识别技术广泛应用于沉浸式应用,界面,游戏以及显示当中。
想要了解OCR及其他行业图像识别技术,看这→→→→→→→→
欢迎对图像识别技术感兴趣的您联系我们,微信公众号:轻搜索(nj_qsooo)——长按可复制
轻搜SaaS平台—http://www.qsooo.net:利用图像识别技术,可快速准确的提取并识别图片主题信息,可供商业与非商业用户免费体验~
标签:手机is语音