chatGPT火爆有一段时间了,不知不觉中,我消耗完了免费的API额度,而网页版又由于众所周知的原因经常无法正常登陆,即便登陆上去,也常常因为众所周知的原因出现错误提示。

顶着chatGPT发布4.0版本的巨大压力,百度开发的文心一言人工智能语言模型于3月16日面向部分用户内测。

作为互联网知名博主(误),本人很快拿到了内测资格。

但在试用几天后发现,情况不容乐观,总的来说就是:东西是有了,但质量还差得远,基本上无法用来当作生产辅助工具。继续阅读

   
江苏卫视的《最强大脑》是一档不错的综艺节目,连着看了三季,今年到第四季了。

   
《最强大脑》留给我印象最深的两个人,一个是主持人蒋昌建,刚开始就被他独特的主持风格吸引,完全不像主持人的台风,说话也是几个字几个字的往外吐,一查简历吓一跳,93年代表复旦大学参加国际大专辩论赛,获得冠军,他本人则被评为“最佳辩手”,话说当年的国际大专辩论赛真是影响了一代人啊!第二个就是被称为“水哥”的王昱珩,《最强大脑》里面的选手都很牛逼,牛逼的人自有一种独特的气质,而水哥给人的感觉则是温暖又独特同时带着一种神秘感。水哥也许不是《最强大脑》节目中实力最强的选手,但绝对是粉丝最多的,大家对他期盼都很高,所以第四季一开始他并没有参赛,后来在嘉宾的鼓动下出场了。

   

   生活中的水哥很有品位

   
我要说的就是《最强大脑》第四季的比赛,节目的设置完全背离了初衷,变得令人大跌眼镜,百度公司在这个节目中不择手段秀下限让人瞠目结舌。节目组为了利益,也是出卖了自己的灵魂。

   
为什么我说得如此严重?

   
看过《最强大脑》前三季以及国外(比如日本的No.1头脑王之类)类似节目的都知道,比拼脑力的是都是人与人之间的对决,正所谓强中自有强中手,人类在记忆力、分析力、速算力等各方面到底展现出多大的极限,高手之间的比拼既让人紧张又让我们叹服,展现了一个日常生活中看不到的世界。但是,《最强大脑》第四季引入了百度所谓的人工智能——小度,让人工智能与人类进行比拼,听起来不错,但这样真的可以吗?或者说,那样的比拼有什么意义?我总结了一下,至少有以下几个方面可以说明百度真的很下作。

   

   
第一,记忆类项目机器获胜,胜之不武

   
《最强大脑》中每一期都有很多不同的游戏项目,绝大多数项目都可以归纳为“记忆项目”,也就是说,不论游戏形式如何,最终比的是选手的记忆力,比如大数字相乘,只要记住固定的若干组乘法结果即可,比如从若干副画中找出被取走的部件,实际上也是考的记忆力,只不过选手们都不可能是死记硬背,而是基于一定的“算法”去短时间内大量记忆然后运用,这也是选手们了不起的地方。

   
然而,人工智能或者说机器人参与记忆类项目,毫无公平可言。大家都知道,计算机的行为分为输入和输出(input/output),一次输入,即可存储在内存中反复调用和计算,人类永远无法做到这一点。所以,《最强大脑》第四季目前出的几期节目中,第一期是看图识人,选手王峰需要在短时间内记住不同的面孔,然后捕捉照片与真人的特征,而机器人小度只需要瞬间将需要的图像扫描如内存,利用程序和算法将特征分析、匹配,即可提交答案,这个过程,对于目前的计算机处理能力来说,毫无难度可言,时间上也是几秒钟的事情。第二期是听音辨人,在数字化时代,人耳朵可以听到的声音都能转换成数字存储在计算机上并分析出其中的频率、波长、功率等特征,依据这些特征再做同型匹配,对于计算机也是没有任何难度的。第三期也就是水哥迎战小度的这期,则是通过视频辨人,水哥需要在模糊、短暂而且较暗的视频中提取嫌疑人的特征,然后通过观察现场中的干扰项,做匹配,水哥确实还是牛逼,三个正确答案都被他发现了的,只不过最后不知怎么擦掉了正确答案,不论是不是没有把握,这样时间紧、记忆量大的项目,人类能做到这个程度是相当了不起了;可是,这对于机器人就不一样了,计算机同样是瞬间提取视频中的有用画面,通过对图像增加亮度、局部放大等,明确特征,然后对干扰项作同样的提取,最后分析,根据概率排序,自然得出结果,这个过程是不需要耗费什么时间的。

   
第二,不切实际吹捧机器人,涉嫌弄虚作假

   
在《最强大脑》的舞台,百度隆重推出的机器人小度,有一个仿真人类的外形,流利的发音,让人觉得很牛逼。

   
其实这不过是百度的自我吹捧而已(详见知乎相关问题)。以目前的科技水平,人工智能根本还无法做到,在没有真人操作的前提下,与人类对答如流、处理人类发出的指令。在节目中,百度为了显摆他们的机器人,特意让小度以人形模样出现在舞台,就像一位真正的选手一样,流利地与观众打招呼,跟傅园慧调侃“洪荒之力”,作答后报告“主持人,我已作答完毕”——这不过是背后的工程师事先录制好的文本而已。当然这里并不是诋毁百度在人工智能领域的技术水平,应该说,就人工智能而言,现如今还没有达到机器人与人类可以直接对话的地步,各个科技公司比拼的核心技术是“算法”和处理能力。就像前段时间谷歌公司开发的阿尔法狗战胜人类围棋高手一样,那并没有什么难度,计算机凭借超强的计算能力,可以在瞬间穷尽后面每一步棋的每一种走法,人类是不可能做到这一点,所以计算机必胜。百度要在人工智能领域称霸,要挑战的也应该是谷歌这类技术公司,和人类拼记忆力和计算力,算什么英雄?

   

   
第三,赞助商参与竞赛,难以避嫌

   
这点就不展开说了,我没有任何证据显示百度是《最强大脑》第四季的赞助商。(有新闻说百度赞助了上千万,不知真假)

   
但是,打破前三季的竞赛方式(人与人的竞赛到这里变成了人与机器),如此拙劣的游戏类型(前面说过纯记忆项目人类与计算机比毫无公平可言),这出了让人得出百度花钱买名誉的结论外,还能得出什么结论呢?我们要看的是人类顶尖高手之间的决斗,谁要那么无聊看计算机秀记忆和处理能力了?所以我建议包括水哥王昱珩在内,拒绝参与有百度机器人的节目,我们拱手让贤好了,让百度机器人与谷歌机器人去比吧,节目名字也可以顺势改成“最强机器人”。

   
我并不想说百度在节目中作弊了或者人为的干扰了比赛结果,但百度既然上了《最强大脑》这个节目,其背后必定是希望借此机会展现自己在人工智能领域的先进技术,所以百度不可能允许自己的产品在银屏前失败,在这样的大前提下,一切问题似乎也就迎刃而解了。

   
对这个节目太失望了,以后不会再看《最强大脑》。最后,用水哥王昱珩的一句话结尾吧:

   王昱珩

   
 

   
 

   
 

近日,百度对旗下重点产品“百度贴吧”下手,几乎封禁了全国所有高校的贴吧。任意进入一所大学的百度贴吧,最下面的发帖框变成灰色不可写状态,红子提示:抱歉,本吧目前只能浏览,不能发贴

我所在的重医的贴吧也未能幸免。

其实,百度搞得这么紧张,反而是在提醒大家不要忘了“那个”事件。关于“那个”事件,借用阿禅同学的话说就是:我相信这里的读者大多数都清楚的,如果你知道,我也知道,你不需留言告诉我;如果你不知道,也不要留言问我,我不会告诉你

一直以来,Google都被称为“高端用户使用的搜索引擎”,因为Google搜索出来的结果质量的确很高,而且不像百度,满屏都是广告。但是众所周知,在国外十分风光牛逼的Google在中国的本土化工作一直很艰难,google.cn这个垃圾搜索引擎的出现就被视为Google妥协的产物,而Blogspot等Google产品一再被封则使其在中国陷入一个尴尬的境地。

在很长的一段时间里,百度都有个很不好的行为,那就是虚假收录量问题。百度大概是出于打造“全球最大的中文搜索引擎”这一伟大品牌,所以对各种网站都保持着异常兴奋的收录量。具体来说,一个网站只要页面超过了5000左右,在百度上搜索时就可以发现已经被收录了上万张网页!我有一个网站,当时内容页才500左右,百度居然收录了12000张页面,这使我相当困惑,我哪有这么多网页啊?后来知道了,这主要有两个方面的原因:其一,百度不管用户体验,把诸如“版权声明”“管理登陆”“打印文章”等页面都收录进去了,而这些页面是完全没必要出现在搜索引擎上的;其二便是上文提到的,百度为了显示其“更懂中文”,所以虚假的显示了收录页面。

曾经很多中小网站被百度收录36800张网页后就再也不增加了,有人以为被百度降权,其实最主要的原因是该网站本身的网页并没有那么多,百度显示“38600页”就已经是虚假的、膨胀了好多倍的数字了。这也是百度历史上著名的现象。后来(大约在去年12月份左右),绝大多数网站在百度上的收录数都有了变化,看来百度改邪归正了,终于显示网站的真实收录量了。

而现在,我惊讶的发现,Google把百度这个流氓的德行学会了,竟然也显示虚假的收录量。下面用事实来说明。

我在Google.cn上搜索我的博客wysls.com的收录量,得到下图的结果:

注意,有275项结果。按照每页显示10个链接的格式,应该有28页左右,而且在页面下方,Google确实显示有10页以上,如下图:

但是,当我点击“3”,即跳转到搜索结果第三页时,出现了下面的页面:

看来,Google只收录了我21个页面啊,搜索结果页上显示的“275”属于Google的浮夸作风了,和之前的百度行径并无差异。

Google的这种表现让我相当失望,可以说,Google在中国的本土化中国还有待改进啊,李开复作为Google安排在这过的精神教父似乎没有充分发挥作用,Google的工作理念也并没有恰当的同中国的实际情况结合起来,导致中国的Google成了“四不像”,成了一款不成熟的产品。如果继续这样下去,Google很容易被中国用户抛弃,被迫退出中国市场。那时候,百度没有了Google这个竞争对手,恐怕睡觉都会笑出声来。