海立方多元化娱乐城电子游戏:为什么人工智能助手更像人工智障?真相了

2017-01-20 08:23:42 来源: 申博亚洲官网登入 举报
0
分享到:
T + -

(原标题:为什么人工智能助手更像人工智障?真相了)

“我不是针对谁,只是在座现在所有做C端智能助理的都是坑。”

在确定这个话题之前,有必要先对群嘲做个限定:

现在:在“API困境”被解决之前(后详)。

人工智能助理:这里指的是Intelligent personal assistant/agent (IPA) 又称为Virtual Personal Assistant/Agent(VPA)——帮助个人完成多项任务或多项服务的虚拟助理,当前讨论的核心驱动力是人工智能。(什么你说用人来做处理单元?那是呼叫中心,也叫客服,最看不起挂羊头卖狗肉的了。)

在座:不止是创业公司,大公司也搞不定,国内国外无所谓。

都是坑:创业公司做消费端的虚拟助理,一定无法实现消费级产品效果。对于巨头也是,我相信大部分的相关负责人都以“进步”为目标,而不敢跟自家CEO担保要以“搞定”为目标。

【什么是智能助理?】

智能助理属于对话式服务

两者的边界不是很清晰,智能助理的功能在前面解释过了;而“对话式服务(conversational service/commerce)”——这是包含智能助理在内的多个产品形态的统称,核心特点是:

对话式:人机交互的方式由图形化交互(GUI-Graphical User Interface)变为以对话作为交互方式(CUI-Conversational User Interface业界暂时还没有定义,这是我自己瞎编的),就是用说话来代替触摸或者鼠标,操作计算设备。

服务:提供服务,解决问题都算,如订机票,购买礼物等。不包括信息查询(如天气)。

也让朋友测试了亚马逊echo的alexa,结果也无法识别”不要“这个最简单的逻辑

这次其实比刚刚好多了,至少4家里面除了google allo,都识别出来我的意图是找餐厅——但是,当我明确提出不要日本菜的时候,给出结果的三家全部都是日本菜......也就是说“不要” 两个字被完全忽略了。

观察大量的用户案例表明,当用户越是个性化需求强烈的时候,对话中出现逻辑和指代关系的频次越高。

“有没有更便宜的?”

“除了大床房以外的房间有么?”

“后天会比今天更冷么?”

“就要刚刚的那个2千多的吧。”

“除了廉价航空,其他的航班都可以。”

以上这些需求是提需求的时候,在对话中经常出现的表达方式,而且看似简单,但是目前没有任何一个NLU的系统或产品能够正确的理解。主要的阻碍就是对逻辑的理解,还有在基于上下文对话中的指代关系的理解失败。

3、NLP不是全部,还要有能力履行(API困境)

NLU并不是智能助理发展的瓶颈,供给端的数据才是。

我们假设如果有一个黑科技出现,使得NLP有了极大的进步,以至于两个条件:1)基于上下文场景的对话;2)口语逻辑,都能被理解了,甚至还能基于场景和上下文用NLG来生成各类问题——它能理解我们所有讲出来的需求。

在用户熟悉的范围内,它能结合所有的过去的对话,历史记录等等内部外部条件,帮助用户尽可能的实现“不用开口,就知道我在这个的需求”。比如当用户提出“推荐餐厅的需求”:

用户:“女朋友周日过生日,推荐一个餐厅,找有江景的,最好桌子旁边有一个大落地窗户,能看到外面的夜景。吃的不要太贵,环境好点,有现场音乐的最好是爵士,不要太吵的。” (btw,这是一个真实需求)

Agent:“菜系有偏好么?”

用户:“意大利餐和法餐都可以,对了不要离外滩太远了”

agent解析出以下选择餐厅的条件:

周日晚(营业)

适合女朋友过生日

有江景

有大落地窗

不要太贵

环境好

有现场音乐,爵士

不能太吵

意大利餐或者法餐

距离外滩不能太远

然后它去哪里找到这样的餐厅呢?在地图服务提供商,或者点评的API提供的信息里只有8,9,两项能找到数据。假设评论中有这样的数据,该用什么方式来传递呢?接口提供的都是结构化的数据,而“环境好”这样的非结构化数据,最多以标签的方式来做,但是这样的话,标签就会有无止境的多也不现实。

这就是我们所谓的“API困境”——当前基于API的数据传递方式,只能1)承载结构化数据;2)承载数量非常有限的结构化数据。

当前基于GUI的产品,都是用API来传递结构化数据。但大量个性化数据往往是非结构化的,以当前API的方式很难被处理。这还是在使用场景或者服务比较简单的情况下。

在用户不熟悉的场景下,agent面对稍微专业一点的服务,就会遇到知识图谱的问题。简单来讲,agent要做推荐的前提是对推荐的内容得先有了解。好比,要向一位不懂酒的用户推荐一款威士忌,那就不能依赖这位用户自己提出的问题(很可能提不出要求),而得依赖“懂行”的自己对威士忌的理解的方方面面来引导用户做合适他的选择。一个助理显然无法拥有所有服务所需的知识图谱。

从知识图谱的结构来看,是相对可被结构化。一个服务可以以各种方式被拆解成很多个方面,但大量的方面在当前是没有结构化数据的(比如我们没有每家餐厅的”营业面积“的数据);甚至很多方面无法用结构化数据来表达(比如每家餐厅有否”适合浪漫约会“的环境)。

因此,智能助理就算有了强大的NLP,还需要全面的知识图谱(结构化数据)和处理并传递非结构化数据的能力——而这两点,在目前是无解的。

总结

在“API困境”解决之前,再加上NLP本身还有很长的路要走,基于人工智能的多任务服务agent不大可能达到C端满意的水平。

创业团队各自最基础的认知计算的能力不会有太大的区别,都是踩在世界顶尖大牛的肩膀上——在这个领域创业团队想和大公司钢正面,不是很理性。

创业团队在垂直领域有些自己的技术突破可以创造一些阶段性的优势,但面对教育市场的大山而言,这点差异远不足以make a difference。

在各自领域,开发者对人工智能相关技术的理解和其带来的交互层面的有效应用,可能会在垂直商业应用上创造更大的差异——比较起”95% VS 98%的识别率“ 而言。

本文来源:雷锋网 责任编辑:彭丽慧_NT5727
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车
+ 加载更多新闻
×

海立方多元化娱乐城电子游戏:大家都爱看

进入新闻频道

投资自己,才是稳赚不赔的生意

热点新闻

态度原创

精彩推荐
海淘品牌
阅读下一篇

首页 首页
太阳城HB电子彩票官网 钱柜娱乐 汇丰北京赛车(PK10)开奖结果 易胜博ysb88登入 5亿彩票网
雪缘足球比分 快乐八 彩票真人游戏 澳门银河网开户 中东国际娱乐
申博网上开户 圣亚导航 买球网 申博太阳城管理网登入 开心七星彩论坛
mg水果怪兽 金莎棋牌 澳门威尼斯人娱乐平台登入 威尼斯人现金充值 北京儿童娱乐城电子游戏