Ekuilibrium Nash Dalam Game Menghentikan Dua Pemain Tanpa Nol-sum Dengan Informasi Asimetris

From Part Number Wiki
Jump to navigation Jump to search


Lu2019DistributedAF mengembangkan algoritme pencarian berbasis gradien untuk game nonkooperatif dengan fungsi biaya yang dapat dibedakan. F ) setara dengan keseimbangan Nash dari permainan nonkooperatif (2), dan kebalikannya adalah benar. Menurut Deng2021GF, kendaraan dapat membentuk formasi yang diinginkan dengan mencari keseimbangan Nash dari permainan berikut. Contoh 1: Kontrol formasi kendaraan. Pertimbangkan masalah pembentukan sepuluh kendaraan di atas digraf tidak seimbang berat yang dijelaskan sebagai Gambar. 3.2. Formasi yang diinginkan dibentuk oleh kendaraan, jika posisi relatif antara kendaraan adalah nilai yang diinginkan. Gambar 1: Jaringan komunikasi sepuluh kendaraan. Selain itu, dalam masalah kami, jaringan komunikasi di antara pemain adalah digraf berbobot tidak seimbang, yang memperluas graf tak berarah dan digraf berbobot seimbang yang dibutuhkan oleh banyak hasil, seperti Frihauf2012NashES ; Li2020GN Terdistribusi ; Koshal2016DistributedAF ; Deng2019DistributedAF ; ZENG2019GNE ; Gadjov2019APA ; Lu2019DistributedAF ; Ye2017DidistribusikanNE ; Deng2021tidak lancar ; Zhang2020DidistribusikanNE. Lebih lanjut, tanpa melibatkan kontrol dinamika nonlinier orde tinggi dan digraf yang tidak seimbang bobotnya, algoritma pencarian ekuilibrium Nash yang ada untuk game nonkooperatif, termasuk Deng2021DistributedSM ; Frihauf2012NashES ; Li2020GN Terdistribusi ; Koshal2016DistributedAF ; Deng2019DistributedAF ; ZENG2019GNE ; Gadjov2019APA ; Lu2019DistributedAF ; Ye2017DidistribusikanNE ; Deng2021tidak lancar ; Zhang2020DidistribusikanNE ; Deng2021DidistribusikanEA ; Romano2020DynamicNS, tidak dapat menyelesaikan masalah. Karena dinamika nonlinier tingkat tinggi dan digraf yang tidak seimbang bobotnya, algoritma pencarian keseimbangan Nash yang ada, Slot Bank Neo seperti Deng2021DistributedSM ; Lou2016NashEC ; Frihauf2012NashES ; Li2020GN Terdistribusi ; Koshal2016DistributedAF ; Deng2019DistributedAF ; ZENG2019GNE ; Gadjov2019APA ; Lu2019DistributedAF ; Ye2017DidistribusikanNE ; Deng2021tidak lancar ; Zhang2020DidistribusikanNE ; Deng2021DidistribusikanEA ; Romano2020DynamicNS, tidak dapat diterapkan untuk masalah ini.

Sebagian besar algoritme pencarian keseimbangan Nash terdistribusi yang ada untuk game nonkooperatif bergantung pada grafik tidak berarah atau digraf berbobot seimbang, seperti Frihauf2012NashES ; Li2020GN Terdistribusi ; Koshal2016DistributedAF ; Deng2019DistributedAF ; ZENG2019GNE ; Gadjov2019APA ; Lu2019DistributedAF ; Ye2017DidistribusikanNE ; Deng2021tidak lancar ; Zhang2020DidistribusikanNE. Deng2021DidistribusikanEA ; Romano2020DynamicNS merancang algoritme pencarian keseimbangan Nash terdistribusi untuk sistem nonlinier orde kedua dan sistem linier orde tinggi. Tujuan dari makalah ini adalah untuk menyelidiki permainan non-kooperatif dari sistem multi-agen nonlinier tingkat tinggi melalui digraf yang tidak seimbang, dan merancang algoritma terdistribusi untuk mencari keseimbangan Nash dari permainan non-kooperatif. Namun, suatu algoritme mungkin tidak efektif pada digraf tidak seimbang berat, meskipun konvergen pada graf tak berarah atau digraf berbobot seimbang (lihat Zhu2019ContinuousTimeCA ). Selain itu, diketahui bahwa digraf tak-berimbang merupakan kepanjangan dari graf tak-berarah dan digraf tak-seimbang, yang memiliki aplikasi lebih luas dan lebih mudah diterapkan dalam praktik keteknikan. Oleh karena itu, perlu untuk menyelidiki permainan nonkooperatif pada digraf berbobot tidak seimbang. Makalah ini mempelajari permainan non-kooperatif dengan pemain nonlinier orde tinggi di atas digraf yang tidak seimbang. Deng2021nonsmooth mengeksploitasi algoritma pencarian berbasis subgradien untuk game nonkooperatif dengan fungsi biaya yang tidak dapat dibedakan. Gadjov2019APA merancang algoritme pencarian berbasis proyeksi untuk game nonkooperatif dengan batasan set cembung.

Bagian ini mengusulkan dua algoritme pencarian keseimbangan Nash terdistribusi untuk permainan nonkooperatif (2) dengan pemain nonlinier orde tinggi (3), dan kemudian menganalisis konvergensinya. Bagian 2 memperkenalkan pendahuluan, dan merumuskan masalah. Analisis masalah kami menghadapi tantangan berikut. Dengan Teorema 1, hasil berikut ini dihasilkan. Dengan Lemma 8, kita dapat memperoleh hasil sebagai berikut. Kemudian, kondisi berikut berlaku. Kondisi seperti itu, misalnya, gagasan yang cocok tentang konveksitas/monotonisitas (lih. Misalnya, Wang2021DOC ; Zhang2017DistributedOC mengembangkan algoritme pengoptimalan terdistribusi untuk sistem Euler-Lagrange. Untuk pengaturan 'pemain yang sering', Glicko mencapai hasil terbaik di antara tiga sistem peringkat utama. Secara khusus, kami bertujuan untuk mengadaptasi hasil dan teknik pembuktian dalam karya Saldi, Basar, dan Raginsky (2018), Lasry dan Lions (2007), dan Anahtarci, Kariksiz, dan Saldi (2019) ke pengaturan yang terdesentralisasi. Oleh karena itu, mirip dengan pembuktian Teorema 1, diperoleh kesimpulan. Sama halnya dengan pembuktian Lemma 6, kesimpulannya dapat langsung ditarik. Akhirnya, Bagian 5 merangkum kesimpulan. Bagian 4 memberikan dua contoh untuk memverifikasi algoritma. Dalam mode dua pemain, pemain dapat bekerja sama dan bermain melawan tim lain yang dikendalikan oleh Wii atau dapat bermain melawan satu sama lain.

Untuk anak-anak yang orang tuanya tidak mengizinkan mereka bermain game di rumah, mereka mungkin memiliki lebih banyak insentif untuk mencoba menyelinap bermain game online selama hari sekolah. Arkade sangat populer dan terletak di banyak tempat dengan anak-anak terus-menerus bermain. Ajari anak-anak Anda bahwa setelah mereka membantu merapikan kamar mereka, mereka akan mendapatkan kesempatan untuk bermain lagi selama satu jam. Hal utama yang menarik adalah Anda dapat bermain secara offline. Kami percaya bahwa metode FF juga dapat berfungsi sebagai algoritme alternatif untuk menyelesaikan PDE umum. Selanjutnya, algoritma berbasis output terdistribusi hanya bergantung pada variabel output dari pemain nonlinier tingkat tinggi daripada semua informasi keadaan. Selanjutnya, algoritma berbasis output (3.2) hanya bergantung pada variabel output dari pemain nonlinier tingkat tinggi daripada semua variabel keadaan. Dibandingkan dengan hasil di Frihauf2012NashES ; Deng2019DistributedAF ; Gadjov2019APA ; Zhang2020DistributedNE, algoritme (3.1) dan (3.2) konvergen secara eksponensial, bahkan dengan adanya parameter yang tidak pasti. Berbeda dengan game nonkooperatif yang dipelajari dengan baik, seperti Lou2016NashEC ; Frihauf2012NashES ; Gadjov2019APA ; Ye2017DistributedNE, formulasi ini melibatkan dinamika pemain nonlinier tingkat tinggi, yang sesuai dengan perkembangan CPS.