For faster navigation, this Iframe is preloading the Wikiwand page for ELF OpenGo.

ELF OpenGo

ELF OpenGo
原作者
  • 田渊栋(Yuandong Tian)
  • Jerry Ma
  • Qucheng Gong
  • Shubho Sengupta
  • 陈卓远(Zhuoyuan Chen)
  • C. Lawrence Zitnick[1]
首次发布v0(2018年5月2日,​6年前​(2018-05-02
源代码库github.com/pytorch/elf
编程语言C++PythonC语言
类型電腦圍棋
许可协议BSD许可证
网站facebook.ai/developers/tools/elf

ELF OpenGoFacebook AI Research團隊(FAIR)所開發的電腦圍棋軟體及所釋出的資料[2]

簡介

ELF OpenGo是Facebook AI Research團隊(FAIR)依照DeepMind在科學期刊《自然》上對於AlphaGo Zero所發表的論文《Mastering the game of Go without human knowledge[3]》與AlphaZero的論文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm[4]》所實做出的開源電腦圍棋程式[5],也就是不使用人類棋譜與累積的圍棋知識,僅實做圍棋規則,使用單一類神經網路從自我對弈中學習(不像AlphaGo以人類角度思考,設計了Policy Network與Value Network)。

訓練網路使用20 blocks x 224 filters,在2000個GPU下訓練兩週[5],相較AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外還有40 blocks x 256 filters)。

由於Facebook所擁有的計算資源,產生出高品質的訓練網路資料與對局棋譜[6][註 1],許多基於相同演算法或是AlphaGo相關論文內容的圍棋軟體都積極測試ELF OpenGo所提供的訓練資料[7][8]

成績

對電腦

Leela Zero

Leela Zero是目前少數有公開程式碼並公開訓練網路資料的圍棋軟體,且仍然有志願者持續投入資源計算演化,故經常被當作其他圍棋軟體的基準。

Facebook自行測試,ELF OpenGo與Leela Zero對戰的成績為198:2[2][註 2]。在Leela Zero的進度網站上也經常會比較現有訓練網路與ELF OpenGo的比較[9]

CGOS

志願者在CGOS上使用Leela Zero的程式引擎以及由ELF OpenGo公開的訓練網路(v0)轉換成Leela Zero格式的訓練網路(即Hash值62b5417b的訓練網路,帳號LZ_62b541_ELF_1600)進行對弈測試[10],但由於目前在CGOS上測試的不是ELF Go的程式引擎,不清楚ELF OpenGo的訓練資料在轉換後的影響。截至2018年5月30日 (2018-05-30),對弈已經超過1000盤,BayesElo分數約3770分[11]

對人

Facebook韩国棋院合作,以中國規則與韓國的世界頂尖棋手對弈(貼目7.5目),在電腦每步限制50秒(使用單機單張NVIDIA Tesla V100),人類不限時間的前提下,每個人至少下兩局,達到14:0的成績[6],對弈對手包括金志錫申真谞朴永训以及崔哲瀚[2]

相關連結

參考資料

  1. ^ pytorch/ELF: ELF: a platform for game research. [2018-05-07]. (原始内容存档于2018-05-03). 
  2. ^ 2.0 2.1 2.2 Facebook Open Sources ELF OpenGo. 2018-05-02 [2018-05-08]. (原始内容存档于2018-05-07). 
  3. ^ Mastering the game of Go without human knowledge. 自然 (期刊). 2017-10-18 [2018-05-06]. (原始内容存档于2018-04-12). 
  4. ^ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. 2017-12-05 [2018-05-06]. (原始内容存档于2017-12-08). 
  5. ^ 5.0 5.1 ELF | Game Research Platform | Facebook AI. [2018-05-06]. (原始内容存档于2018-05-06). 
  6. ^ 6.0 6.1 6.2 6.3 Releases · pytorch/ELF. [2018-05-06]. (原始内容存档于2019-02-15). 
  7. ^ Releases · gcp/leela-zero. [2018-05-09]. (原始内容存档于2019-10-16). 
  8. ^ Releases · zakki/Ray. [2018-05-07]. (原始内容存档于2019-02-15). 
  9. ^ 9.0 9.1 Leela Zero. [2018-05-06]. (原始内容存档于2018-05-05). 
  10. ^ Crosstable for LZ_62b541_ELF_1600. [2018-05-07]. (原始内容存档于2018-05-07). 
  11. ^ 19x19 All Time Ranks. [2018-05-30]. (原始内容存档于2018-01-17). 

註解

  1. ^ 包含所有電腦對弈棋譜,以及12盤人類棋手願意公開的棋譜資訊(14盤中有2盤因尊重棋手意願不公開[6])。另外在棋譜中未納入人類棋手的名字[6]
  2. ^ Leela Zero的訓練網路為2018年4月25日所訓練出的第128代,Hash值為158603eb[9]的版本。

外部連結

{{bottomLinkPreText}} {{bottomLinkText}}
ELF OpenGo
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?