AI Poker Bot Pluribus ชนะมืออาชีพชั้นนำใน NLHE แบบผู้เล่นหลายคนโดยมีค่าใช้จ่ายเพียง $ 144 ในการรัน

เร่งความเร็วเกมของคุณด้วย Live Speed ​​Baccarat



บอทเกมโป๊กเกอร์ใหม่ล่าสุดได้รับการพัฒนาโดยทีมวิจัยเดียวกันกับที่นำเสนอ Libratus ในปี 2017 และในครั้งนี้มันสามารถเอาชนะทีมผู้เล่นโป๊กเกอร์ชั้นนำในเกม NLHE 6 มือได้สำเร็จ Facebook ทำงานร่วมกับนักวิจัยจากมหาวิทยาลัย Carnegie Mellon ซึ่งนำโดยศาสตราจารย์ Tuomas Sandholm ของ CMU และ Noam Brown นักศึกษาระดับปริญญาเอกของเขาซึ่งกำหนดการประลองด้วยคอมพิวเตอร์โป๊กเกอร์ AI เวอร์ชันล่าสุดที่เรียกว่า “Pluribus” เทียบกับผู้เล่นโป๊กเกอร์ที่ดีที่สุดในอุตสาหกรรม และผลการวิจัยซึ่งตีพิมพ์เมื่อต้นเดือนนี้ในวารสาร Science นั้นน่าทึ่งมาก บอทสามารถเอาชนะคู่ต่อสู้ได้ซึ่งเป็นสิ่งที่ AI อื่นไม่เคยทำได้มาก่อน (โปรแกรม AI ก่อนหน้านี้สามารถชนะได้ในเกมโป๊กเกอร์ที่มีผู้เล่นสองคนเท่านั้น) คาดว่าผลลัพธ์ของโครงการนี้จะมีผลกระทบหลักสำหรับการวิจัย AI และเกมโป๊กเกอร์เอง Two TrialsPoker ถือเป็นเกมที่รวบรวมความท้าทายของข้อมูลที่ซ่อนอยู่ได้ดีนักวิจัยจึงใช้มันเป็นความท้าทายในการสร้างและพัฒนาปัญญาประดิษฐ์ อย่างไรก็ตามไม่มีเครื่องจักรใดที่สามารถเอาชนะผู้เล่นที่เป็นมนุษย์ได้ในการตั้งค่าผู้เล่นหลายคนสำหรับ Texas Hold’em (รูปแบบที่นิยมมากที่สุดสำหรับการเล่นโป๊กเกอร์) จนกระทั่ง Pluribus มาถึง Pluribus ต่อสู้กับมือโปรโป๊กเกอร์ที่ดีที่สุดในรูปแบบ NLHE 6-max ข้อดีคือผู้เชี่ยวชาญ 6-max ที่ได้รับรางวัลอย่างน้อย 1 ล้านเหรียญจากอาชีพโป๊กเกอร์มืออาชีพ พลูริบัสได้รับการทดลองสองครั้งที่แตกต่างกัน ในการทดลองครั้งแรกมนุษย์ห้าคนและ AI หนึ่งตัว (5H + 1AI) ถูกวางไว้ข้างๆกันในขณะที่ในการทดลองครั้งที่สองมีมนุษย์เพียงคนเดียวที่พบโคลนนิ่งพลูริบัส 5 ตัว (1H + 5AI) เนื่องจากบอทไม่ได้รับอนุญาตให้สื่อสารและ พวกเขาไม่รู้ว่ากำลังเล่นกับใครซึ่งขัดขวางการทำงานร่วมกัน ชัยชนะของ Pluribus ผลจากการทดลองทั้งสองครั้งพบว่าเปอร์เซ็นต์การชนะของ Pluribus นั้นสูงกว่าอย่างมีนัยสำคัญเมื่อเทียบกับผู้เล่นโป๊กเกอร์ที่เป็นมนุษย์ ผู้เล่นบางคนที่เข้าร่วมการทดลอง ได้แก่ Anthony Gregg, Dong Kim, Greg Merson, Jacob Toole, Jason Les, Jimmy Chou, Linus Loeliger, Michael Gagliano, Nick Petrangelo, Sean Ruane, Seth Davies และ Trevor Savage โดยผู้เล่นแต่ละคนใช้ a ชื่อเล่นระหว่างเกม ในการทดลอง 5H + 1AI มีการเล่นทั้งหมด 10,000 มือในช่วง 12 วันในขณะที่ในการทดสอบ 1H + 5AI ผู้เล่นโป๊กเกอร์ Darren Elias และ Chris Ferguson เล่น 5,000 มือต่อสำเนา Pluribus 5 เล่ม เมื่อผลสำเร็จปรากฎว่าค่าปรับสามารถตีคนได้ประมาณ 5 เหรียญต่อมือและเกือบ 1,000 เหรียญต่อชั่วโมงตามโพสต์บล็อก Facebook AI ของ Noam Brown วิดีโอสาธิต Pluribus vs Pros: ข้อดีของโป๊กเกอร์คิดอย่างไรกับ AI Pluribus นี่คือสิ่งที่ผู้เข้าร่วมการทดลองพูดถึงด้านล่างของโป๊กเกอร์ล่าสุด Seth Davies: “สิ่งที่กระตุ้นมากที่สุดในการเล่นกับ Pluribus คือการตอบสนองต่อกลยุทธ์ preflop ที่ซับซ้อนซึ่งแตกต่างจากมนุษย์ Pluribus ใช้ preflop หลายขนาดความสูงการพยายามตอบสนองต่อพื้นที่เปิดโล่งที่ไม่ใช่เชิงเส้นถือเป็นความท้าทายที่สนุกแตกต่างจากเกมของมนุษย์” Jason Les: “มันเป็นมอนสเตอร์บลัฟแน่นอนฉันอยากจะบอกว่ามันเป็นบลัฟที่มีประสิทธิภาพมากกว่าคนส่วนใหญ่มากและนั่นคือสิ่งที่ทำให้ยากที่จะเล่นกับคุณคุณมักจะอยู่ในสถานการณ์ที่มีความกดดันมากมายเหมือนที่ AI ใส่ กับคุณและคุณก็รู้ว่ามันมีแนวโน้มที่จะทำผิดพลาดที่นี่มาก “Jimmy Chou:” เมื่อฉันเล่นได้ดีฉันรู้สึกว่าฉันกำลังหยิบอะไรใหม่ ๆ เพื่อรวมเข้ากับเกมของฉันในฐานะมนุษย์ฉันคิดว่าเรามักจะทำให้เกมง่ายขึ้น สำหรับตัวเราเองซึ่งทำให้กลยุทธ์นำไปใช้และจดจำได้ง่ายขึ้นบอทไม่ใช้ทางลัดใด ๆ เหล่านี้และมีโครงสร้างเกมที่ซับซ้อน / สมดุลมากสำหรับทุกการตัดสินใจ “คริสเฟอร์กูสัน:” พลูริบัสเป็นคู่ต่อสู้ที่ยากมากที่จะเล่นกับมัน ยากมากที่จะยึดเขาไว้กับมือชนิดใดก็ได้นอกจากนี้เขายังทำได้ดีมากในการเดิมพันมูลค่าเล็กน้อยบนแม่น้ำเขาเก่งมากในการดึงคุณค่าจากมือที่ดีของเขา “ดาร์เรนเอเลียส:” เป็นแค่ฉันแล้วก็ห้ารุ่น บอท AI โป๊กเกอร์นี้ใช่ g จะเล่นกับทุกวันหลายพันมือ มันพัฒนาขึ้นอย่างรวดเร็วตั้งแต่การเป็นผู้เล่นระดับปานกลางไปจนถึงผู้เล่นโป๊กเกอร์ระดับโลกในไม่กี่วันและหลายสัปดาห์ ซึ่งค่อนข้างน่ากลัว Pluribus โดยสรุปในปัจจุบันมีความปลอดภัยที่จะกล่าวได้ว่าหนึ่งในผู้เล่นโป๊กเกอร์ที่ดีที่สุดของโลกไม่มีหน้าโป๊กเกอร์หลักของ Pluribus หรือกลยุทธ์การวาดภาพถูกสร้างขึ้นจากการเล่นด้วยตนเองหรือการแข่งขันกับโคลนด้วยตัวเอง เป็นวิธีการเดียวกับที่ใช้ในการสร้าง OpenAI Five ซึ่งเป็นทีมที่มีเครือข่ายประสาทเทียม 5 เครือข่ายซึ่งได้รับการฝึกฝนมาเป็นเวลา 45,000 ปีและสามารถเอาชนะทีม eSports มืออาชีพในวิดีโอเกม Dota 2 ได้ Pluribus เรียนรู้ตั้งแต่เริ่มต้นและใช้ประเภท ของการเรียนรู้การเสริมกำลังเช่นเดียวกับ DeepMinds Go AI ใช้ AlphaZero เริ่มต้นด้วยการเล่นโป๊กเกอร์แบบสุ่มและปรับปรุงเมื่อตัดสินใจว่าการกระทำใดได้รับเงินมากกว่าหลังจากแต่ละมือจะจำได้ว่าเล่นอย่างไรและสงสัยว่าจะทำเงินได้มากขึ้นหรือไม่ด้วยการกระทำที่แตกต่างกันเช่นการเพิ่ม แทนที่จะยึดติดกับตัวเลือกหากตัวเลือกนำไปสู่ผลลัพธ์ที่ดีกว่าก็มีแนวโน้มที่จะเลือกพวกเขาในสถานการณ์ในอนาคตโดยการเล่นโป๊กเกอร์หลายล้านมือกับสูตรของตัวเอง ade Pluribus เป็นกลยุทธ์พื้นฐานที่ใช้ในการแข่งขัน สำหรับการตัดสินใจแต่ละครั้ง Pluribus จะเปรียบเทียบสถานะของเกมกับการวาดภาพและคาดการณ์การเคลื่อนไหวเล็กน้อยเพื่อดูว่าเกมจะออกมาเป็นอย่างไร จากนั้นจะพิจารณาว่าสามารถปรับปรุงได้หรือไม่ ด้วยการสอนตัวเองโดยไม่ต้องใช้ความพยายามของมนุษย์ Pluribus ใช้กลยุทธ์บางอย่างที่ผู้เล่นที่เป็นมนุษย์จะไม่พิจารณาใช้ ความสำเร็จของพลูริบัสส่วนใหญ่เกิดจากประสิทธิภาพ เมื่อเล่นโป๊กเกอร์จะทำงานบนหน่วยประมวลผลกลาง (ซีพียู) เพียงสองหน่วยซึ่งแตกต่างจากโปรเซสเซอร์ Libratus 100 และ Go-bot ดั้งเดิมของ DeepMind ซึ่งใช้โปรเซสเซอร์เกือบ 2,000 ตัวเมื่อพวกเขาเอาชนะผู้เล่นระดับบนได้เป็นครั้งแรก เมื่อพลูริบัสเล่นกับตัวเองมันจะเล่นมือประมาณ 20 วินาทีเร็วกว่าผู้เล่นมืออาชีพประมาณสองเท่า สิ่งที่ยอดเยี่ยมอีกอย่างเกี่ยวกับ Pluribus คือซอฟต์แวร์ทำงานบนเซิร์ฟเวอร์คลาวด์ที่มีราคาเพียง 144 เหรียญเท่านั้นในการทำงาน ในการเปรียบเทียบ Libratus ใช้พลังงานจากซูเปอร์คอมพิวเตอร์มูลค่า 9.65 ล้านเหรียญซึ่งมีราคาแพงมากในการรัน แน่นอนว่าการทดลองนี้ไม่ได้จบลงด้วยโป๊กเกอร์ แม้ว่าจะเป็นความสำเร็จที่ยิ่งใหญ่ในการเอาชนะนักโป๊กเกอร์มืออาชีพที่เก่งที่สุดในเกมหกมือ แต่ก็แสดงให้เห็นว่าพลังในการคำนวณของมันอาจมีจุดประสงค์ที่แตกต่างจากการเล่นไพ่ ผลการวิจัยชี้ให้เห็นความจริงที่ว่า AI สามารถทำงานในระดับ “เหนือมนุษย์” ในสถานการณ์ที่มีหลายเรื่องและการเข้าถึงข้อมูลที่ จำกัด และอาจนำไปใช้ที่ใดก็ได้ตั้งแต่วาณิชธนกิจและกลยุทธ์การเจรจาไปจนถึงเทคโนโลยียานยนต์ที่ขับเคลื่อนด้วยตนเองตามที่ Brown กล่าว Pluribus กำลังเข้าร่วมเกมอย่าง Chess and Go ซึ่งเป็นสองเกมที่ผู้เล่นที่เป็นมนุษย์ที่ดีที่สุดในโลกต้องพ่ายแพ้ต่อปัญญาประดิษฐ์ ที่มา: https: //science.sciencemag.org/content/early/2019/07/10/science.aay2400


คาสิโน ออนไลน์ ที่ดีที่สุด
123 yesคาสิโน
คาสิโน ที่ดีที่สุด
คาสิโนufabet
คาสิโน ufabet

Leave a Reply

Your email address will not be published. Required fields are marked *