重生之AI教父

CloseAI

首页 >> 重生之AI教父 >> 重生之AI教父最新章节(目录)
大家在看官途狂飙:从秘书到省委书记 官场争雄,从女书记的秘书开始 想当神医被告,果断转行做兽医 四合院:咸鱼的美好生活 重生徐江独子,我绝不下线 我的年代,从四合院开始 四合院我何雨柱是厨神 四合院:何雨柱的平凡日子 我在港综抽奖 四合院:继承小酒馆,嫂子徐慧真 
重生之AI教父 CloseAI - 重生之AI教父全文阅读 - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 好看的都市小说

第207章 Attention is all you need

上一页书 页下一章阅读记录

“你是说文字的长期依赖问题?”伊利亚微微皱眉,捕捉到了重点:“不过长期依赖问题,已经相当程度上被循环网络的进化版本,长短期记忆方法又或者是各种门控制给解决了。”

“说是解决了,但实际上是减轻了,终究还是治标不治本,只是把症状压了下去。”

“那怎么办?难道干脆就不要了?”伊利亚没想那么多,随口问道。

问完却发现,孟繁岐正在似笑非笑地看着他。

“你是认真的?”伊利亚此前是被思维的惯性局限住了,根本没有想到注意力机制这样一个配菜,能干脆成为主餐,取代原本常用的网络结构。

现在孟繁岐已经暗示了他的想法,伊利亚自然也就开始认真地考虑这种操作的可行性。

“原本最常见的循环网络和卷积网络互有利弊,如果长度为n,前向的复杂度是O(n)级别,卷积是O(1)级别。但是卷积的每层复杂度要再根据卷积核的大小增加开销。”

“倘若用注意力机制去做,前向的复杂度是O(1),每层的复杂度则从O(nd^2)变为O(n^2d)。关键是,它可以并行了!”

分析复杂度分析到一半,伊利亚眼睛一亮,发现了重点。复杂度只是小事情,能够轻松并行才是最关键的地方。

传统的长短期和循环网络,可以处理时间序列信息,但总是需要根据之前的信息来推测当前的信息,依赖前置位的信息,因而无法并行。

简单点说,就是能并行的模型学不到长距离语言之间的联系,能学到的又没法并行。无法并行,用现在的设备自然就很难把语言模型做大。

“可目前最强力的模型都是带门控制,编码器加解码器的循环网络和卷积网络...难道我们真的一点旧有的技术都不使用吗?”

旁边有旁听的同事越听越觉得不靠谱了,这一步子跨得也有点太大了,咔,容易扯着蛋。

“它可以无视语言中,两个词之间的距离为它们单独建立相关性关系,单独这一点,就足以成为我们尝试的理由了。你们翻译任务当中,长句不也是相当令人头疼的问题吗?”

句子一长,就容易出岔子,加上目前的模型还喜欢持续累加各个词的信息。

机器看到中间,早就忘记前面是什么内容了。

“我是谁?我在哪?我在干吗?”

喜欢重生之AI教父请大家收藏:(m.20xs.org)重生之AI教父20小说网更新速度全网最快。

上一页目 录下一章存书签
站内强推十日终焉 不要在垃圾桶里捡男朋友 御兽从零分开始 烟雨楼 长生从炼丹宗师开始 截教扫地仙的诸天修行 长安好 六零:冷面军官被科研大佬拿捏了 重回1982小渔村 乡村滥 逆天悟性:从开创观想法开始长生 四合院,别惹我 小师妹生来反骨,女主掉坑她埋土 大婚当天,假千金改嫁世界首富了 重生大时代之王 官路之谁与争锋 规则怪谈:我能完美利用规则 四合院之傻柱的小日子 重生2000:从追求青涩校花同桌开始 穿越四合院之开局落户四合院 
经典收藏重回1982小渔村 重生1989:缔造华夏科技帝国 官媛 四合院:盖世无双何雨柱 我穿梭两界当倒爷 四合院:开局报警抓傻柱 四合院之破落户翻身 四合院之我也来凑热闹 四合院:打猎在1962 重生官场:开局迎娶副省长千金 四合院苟生七十年 我在港综抽奖 四合院:从采购员开始的幸福生活 四合院之坑人无数却都说我好人 四合院:阿瞒看了直点头 年代:小日子过的真好 四合院我跟贾东旭换老婆 四合院:我当电工的幸福日子 四合院:重生60年,悟性逆天 四合院之何雨柱轮回从51年开始 
最近更新抗战之新晋绥军 都市传奇食路陈宇的逆袭之旅 新世纪道士讨生活指南 真相的暗影 获得壁虎神功后,我迈向人生巅峰 擎天之生来倔强 我,异能雷劫,渡尽天下妖魔 天才少年医生 雹泉镇黑道 重生2009,财色兼收 一个民校教师的奋斗史 建立超级家族,从隐居山林开始 歪歪人生路 斩神:以开拓之名,狩猎诸神 我的文娱帝国 神眼鉴宝,暴富不过分吧 病娇影后又炸毛?赶紧亲一口 家装风云录 都市炼体狂潮 在疾病面前觉醒算个屁 
重生之AI教父 CloseAI - 重生之AI教父txt下载 - 重生之AI教父最新章节 - 重生之AI教父全文阅读 - 好看的都市小说