图文综合整理自KnowingAI知智
你说的人工智能是哪种智能?
一分钟,轻松了解 AI 领域基础概念!
通常人们所说的人工智能,和真正的人工智能是什么关系?
「通用人工智能」(AGI)和「应用人工智能」(Applied AI)最大的区别是什么?
不用很麻烦很累,点击观看下方视频,你对人工智能的认知就能轻松超过全世界 99% 的人类!
欢迎大家留言讨论~
一分钟看懂计算机视觉
为什么要让计算机看见世界?
让计算机看见世界分几步?又有什么用?
图文版本,送给不方便打开视频的朋友们(☆w☆)
计算机视觉是一门研究让机器「看」见世界的科学。
人类能够认出照片中的事物,推理它们之间的关系,但对于计算机来说,图像只是一连串 RGB 数值 ,没有任何意义。
让机器看见世界有四个阶段,也是计算机视觉的四个核心问题:
图像分类(image classification),即为不同的图片打上对应标签;
物体检测(Object Recognition),找到物体的位置,并认出他们是什么;
语义分割(Semantic Segmentation),找到物体之间的关系和联系;
视频分析(Video Analysis),即看懂视频中的内容。
(前两者让计算机「看见」世界,后两者让计算机「看懂」世界。)
让计算机看见世界有什么用?
小到手机拍照中的人脸定位,银行里的人证比对;
大到自动驾驶、医疗影像诊断,都是计算机视觉的用武之地。
一分钟看懂语音识别
将语音变成文字,总共分几步?
图文版本,送给不方便打开视频的朋友们(☆w☆)
与计算机视觉不同,语音识别有且只有一个核心任务——
将人类的语音转换成文字。
这个过程并不涉及对语音内容的理解
机器如何识别语音?
语言由单词组成,单词由音素组成。
我们将一段语音的声波按帧切开,用帧组成状态,用状态组成音素,再将音素合成单词,语音就变成了文字。
严格来说不是逐帧切开,帧与帧之间有所交叠
与语音相关,仍属人工智能研究范围内的任务还有不少。
声纹识别(Speaker Recognition),即识别说话者是谁;
语音合成(Speech Synthesis),即将文字信息转换为人类听得懂的语音。
Siri、智能音箱、车载设备,都是语音识别看得见、摸的着的应用。
感觉效果不好?口音、距离、噪声都会影响识别结果,下次可以换个安静的环境试试。
领取专属 10元无门槛券
私享最新 技术干货