JPY ¥4,536
◆強化学習は「ポストビッグデータ」の技術である! 人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます. ◆強化学習の「いま」を知り,「これから」を切り拓くための1冊. 本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します. ・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入. ・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説. ・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説. ――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!  紀伊國屋書店ウェブストア

JPY ¥3,080
Pythonで動作する深層強化学習フレームワーク「ChainerRL」を用いて、深層強化学習を実際に使いこなすことに焦点を当て、開発環境の構築から深層学習、強化学習、深層強化学習とステップアップ方式で、基礎から実際のモノを制御する応用までを解説。  セブンネットショッピング

JPY ¥3,608
強化学習、さらにディープラーニングを組み合わせた深層強化学習DQN(Deep Q-Network)という用語を目にする機会が増えています。本書は関連の概念を分かりやすく解説しつつ、Python+PyTorchで「倒立振子課題」「迷路を解くプログラム」「ブロック崩しの攻略」を実装していきます。 第1章「強化学習の概要」では機械学習とその3分類(教師あり学習、教師なし学習、強化学習)について紹介します。 第2章「迷路課題に強化学習を実装しよう」では、簡単な強化学習(方策勾配法、Sarsa、Q学習)のコードをひとつずつ実装しながら、強化学習のアルゴリズムと実装方法を理解します。迷路を最短ルートでゴールするよう強化学習させます。 第3章「倒立振子課題に強化学習を実装しよう」では、2章で学んだ強化学習の基本をより複雑な課題への適用します。倒立振子とは、“ほうきを手のひらの上に立てる”遊びと同じ内容でその制御ルールを強化学習させます。Anacondaを用いたセットアップ方法も解説します。 第4章「Pytorchでディープラーニングを実装しよう」では、ディープラーニングの内容を理解し、PyTorchで実装します。ニューラルネットワークとディープラーニング発展の歴史、学習フェイズと推論フェイズについて解説。最後に手書き数字の画像を分類するMNIST課題を実装解説します。 第5章「深層強化学習DQNを実装しよう」では、強化学習にディープラーニングを組み合わせた“深層強化学習”を理解し、DQNを実装できるようにします。第3章の倒立振子課題に対してDQNを実装します。 第6章「深層強化学習の発展版を実装しよう」では、新しい深層強化学習の手法、Double-DQN、Dueling Network、Prioritized Experience Replay、そしてA3C、A2Cを理解し、実装できるようにします。 第7章「AWSのGPU環境でブロック崩しを実装しよう」では、ブロック崩しゲームを対象に深層強化学習のA2Cを実装します。実行環境としてAmazonのクラウドサービスAWSのGPU環境を使用する方法も解説します。  紀伊國屋書店ウェブストア

JPY ¥3,806
説明  小動物の日々の栄養補給と体調や食欲の維持をサポートします。 三晃 プロテイン エナジーバイト 30g×3 対象 ハリネズミ、フクロモモンガ、ハムスター、シマリス等の昆虫食を好む小動物 特長 ●昆虫食を好む小動物のための栄養補完食、栄養強化食です。 ●小麦胚芽油をベースにしてコラーゲン等の昆虫食性を持つ生き物が、消化しやすい良質なたんぱく質を強化配合したので口当たりが良いです。 ●タンパク質を強化配合。スタミナ強化をサポートします。 ●食欲や健康の維持をサポートします。 ●食欲不振時にもおすすめです。 ●与えやすいペーストタイプです。 ●健康に欠かせないビタミンE、Fがタップリと含まれています。 内容量 30g×3 原材料 ショ糖、小麦胚芽油、大豆油、コラーゲン、大豆パウダー、タウリン、ビタミン類(E、ナイアシン、コリン、パントテン酸、K、B1、B6、B2、D3、葉酸、B12)、ミネラル類(カリウム、カルシウム、亜鉛、鉄、マンガン、銅,ヨウ素)、保存料(デヒドロ酢酸ソーダ、パラオキシ安息香酸) 与え方 ●1日に約1gまでを目安に食べさせてください。チューブから1cmほど搾り出すと  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,675
Steam Deck 液晶保護フィルム 高光沢 9H 強化ガラス 強化ガラス 保護フィルム/液晶保護フィルム 強化ガラス 液晶保護シート スチームデック 液晶保護フィルム 保護 衝撃 防指紋 傷  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,300
理論は裏切らない! ・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!/【おもな内容】 第1章 準備 1.1 強化学習とは 1.2 マルコフ決定過程と逐次的意思決定問題 1.3 方策 1.4 逐次的意思決定問題の定式化 第2章 プランニング 2.1 準備 2.2 動的計画法 2.3 動的計画法による解法 2.4 線形計画法による解法 第3章 探索と活用のトレードオフ 3.1 概要 3.2 探索と活用のトレードオフ 3.3 方策モデル 第4章 モデルフリー型の強化学習 4.1 データにもとづく意思決定 4.2 価値関数の推定 4.3 方策と行動価値関数の学習 4.4 収束性 4.5 アクター・クリティック法 第5章 モデルベース型の強化学習 5.1 問題設定の整理 5.2 環境推定 5.3 ブラックボックス生成モデルに対するプランニング 5.4 オンラインのモデルベース型強化学習 第6章 関数近似を用いた強化学習 6.1 概要 6.2 価値関数の関数近似 6.3 方策の関数近似 第7章 部分観測マルコフ決定過程 7.1 部分観測マルコフ決定過程(POMDP)の基礎 7.2 POMDP のプランニング 7.3 POMDP の学習 第8章 最近の話題 8.1 分布強化学習 8.2 深層強化 学習付録A 補足A.1 証明 A.2 ノルム A.3 線形計画法 A.4 自然勾配法の補足  紀伊國屋書店ウェブストア

JPY ¥3,300
理論は裏切らない! ・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!/【おもな内容】 第1章 準備 1.1 強化学習とは 1.2 マルコフ決定過程と逐次的意思決定問題 1.3 方策 1.4 逐次的意思決定問題の定式化 第2章 プランニング 2.1 準備 2.2 動的計画法 2.3 動的計画法による解法 2.4 線形計画法による解法 第3章 探索と活用のトレードオフ 3.1 概要 3.2 探索と活用のトレードオフ 3.3 方策モデル 第4章 モデルフリー型の強化学習 4.1 データにもとづく意思決定 4.2 価値関数の推定 4.3 方策と行動価値関数の学習 4.4 収束性 4.5 アクター・クリティック法 第5章 モデルベース型の強化学習 5.1 問題設定の整理 5.2 環境推定 5.3 ブラックボックス生成モデルに対するプランニング 5.4 オンラインのモデルベース型強化学習 第6章 関数近似を用いた強化学習 6.1 概要 6.2 価値関数の関数近似 6.3 方策の関数近似 第7章 部分観測マルコフ決定過程 7.1 部分観測マルコフ決定過程(POMDP)の基礎 7.2 POMDP のプランニング 7.3 POMDP の学習 第8章 最近の話題 8.1 分布強化学習 8.2 深層強化 学習付録A 補足A.1 証明 A.2 ノルム A.3 線形計画法 A.4 自然勾配法の補足  BOOK☆WALKER

JPY ¥3,190
はじめに 機械学習と深層学習 強化学習の基礎 価値ベース手法による深層強化学習 方策勾配法による深層強化学習 モデルベース手法による深層強化学習 汎化性 オンライン問題に特有の課題 深層強化学習のベンチマーク MDPを超える深層強化学習 深層強化学習の展望 結論  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,046
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,060
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,740
注目の最新AI技術!深層強化学習の開発手法がわかる! 第一線で活躍する著者陣の書下ろしによる待望の1冊! 【本書の目的】 AlphaGo(アルファ碁)でも利用されている深層強化学習。 AIサービスのみならずロボティクス分野でもその応用が期待されています。 本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。 【本書の特徴】 第1部では、まず、深層強化学習の概要について説明します。 次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。 さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。 第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。 1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。 2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。 3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。 全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。 【読者が得られること】 深層強化学習による開発手法を学ぶことができます。 【対象読者】 深層強化学習を学びたい理工学生・エンジニア ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。 ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。 ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。 ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。  紀伊國屋書店ウェブストア

JPY ¥3,740
注目の最新AI技術!深層強化学習の開発手法がわかる!第一線で活躍する著者陣の書下ろしによる待望の1冊!【本書の目的】AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。【本書の特徴】第1部では、まず、深層強化学習の概要について説明します。次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。【読者が得られること】深層強化学習による開発手法を学ぶことができます。【対象読者】深層強化学習を学びたい理工学生・エンジニア※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。  BOOK☆WALKER

JPY ¥2,033
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,046
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,046
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,960
【まえがき】※一部抜粋本書では強化学習を実世界の問題に応用することを目指したい研究者(大学院生含め)や企業の技術者を主な対象にして,実応用向きの強化学習技術について紹介している.これらは,過度に数理的な説明に踏み込みすぎずに概念的な理解を重視して説明するよう試みたつもりである.また,最近の強化学習論文では前提となっていて丁寧に紹介してもらえないテクニックや問題意識などについても適宜まとめているので,最新論文を読む下地としても有用であろう.このように本書は,既存の強化学習ライブラリの利用方法をまとめたような入門書では満足できない,かと言って強化学習の詳細な数理に踏み込んで何故強化学習が上手く動くのかまで深く理解する段階ではない,いわば強化学習に入門を終えた強化学習ユーザー向けの構成となっている.そのため,強化学習の基礎的な内容も本書には一応載せているが,比較的簡潔に留めたつもりである.また,本書を参考に新たな強化学習アルゴリズムの開発をすることも可能だと思うが,その際は必要に応じて他書や最新論文から理論的な補強をすると良いだろう.本書は上記の対象を念頭に,まず1 章で強化学習の狙いや難しさを数理を一旦省いて言語的に紹介することで,大まかな思想を共有する.その後に,その実現に必要とされる強化学習理論や最新技術の詳細を数理的に紹介していく.具体的には,2 章で強化学習の問題設定を数理的に改めるとともに,本書で必要となる幾つかの道具を紹介する.3 章では,強化学習の最も基礎となる学習アルゴリズムと,近年の主流である深層強化学習で頻出の技術についてもまとめる.4 章では,実世界への強化学習応用に向けた,行動として実数値を扱える強化学習手法の中の最新技術を,重要となる概念・技術とともに紹介する.また5 章では,実世界でエージェントが効率良く学習するために有力な方法論であるモデルベース強化学習について,その基礎と応用法を分類分けしながらまとめる.6 章では,実世界で強化学習を利用する際の恐らく最大の悩みの種となるであろう報酬の設計に関して,様々な対応策を簡潔に紹介する.最後に7 章では,筆者が今後特に期待している強化学習に関する話題を幾つか提供する.  セブンネットショッピング

JPY ¥2,243
指強化ハンドグリップ強化剤フィンガーエクササイザー運動器具手首の手のためのフィンガーエクステンサー強化剤 説明: フィンガーストレッチャーを使用すると、指、前腕、手首の強度を簡単に向上させることができます。 それは高品質のシリコーンを主な材料として使用しており、優れた弾力性を持ち、裂け、壊れ、変形しにくいです。 仕様: 名前: シリコンフィンガートレーナー 材料: シリコーン 重量: 37g (リストストラップを含む) サイズ: 約11.5x10cm/4.53 x 3.94in 穴径: 約1.8/0.71in ラリー: 黒 (13lb、17lb、21lb)/灰色 (6.6lb、8.8lb、11lb) パッキングリスト: フィンガーエクササイズ * 1個とリストストラップ * 1個 注: 照明や画面の設定が異なるため、商品の色は写真と多少異なる場合があります。 手動測定の違いにより、サイズの違いは1?2cmになります。 を表示製品詳細 1.【幅広い用途】フィンガーストレングスナーは、指の強さと運動の柔軟性を高めることができるため、ロッククライマー、テニスプレーヤー、ベースプレーヤー、ギタ  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,300
Pythonによる実装で、強化学習×転移学習のパワフルさを体感しよう 《本書の特長》 ●強化学習の理論の初歩から丁寧に解説。Pythonによるシミュレーションを実装しながら手法を体感できるので、簡単なプログラミング経験があれば、つまずくことなく読み進めることができます。 ●後半では、学習した知識を再利用する技法である「転移学習」と強化学習とを組み合わせた「転移強化学習」について詳しく解説されています。強化学習と同様に、シミュレーションを通して、転移学習による学習の高速化、高精度化を試すことができます。 ●理論と実装だけでなく、学習の自動化・省力化のための一段高度なチューニング技法や、コーディングの際に気を付けなければいけない落とし穴ももれなく解説。この1冊で、転移強化学習の基礎から応用までをすみずみまで学べます。 本書で紹介したソースコードは、森北出版Webサイトで公開されています。  紀伊國屋書店ウェブストア


JPY ¥3,024
深層強化学習の入門から実装まで、この一冊でわかる! アルファ碁などのゲームAIやロボットアームの制御、自動運転などで注目されている深層強化学習の基礎と、Pythonによる実装について解説した入門書です。 強化学習に適したライブラリであるChainer(ChainerRL)と、AIシミュレーション環境であるOpenAI gymを用いて解説しています。 ソフトウェアシミュレーションだけでなくRaspberryPiとArduinoを用いた実環境への応用も解説しているので、ソフト・ハード問わず自身の課題に深層強化学習を応用することできるようになっています。  紀伊國屋書店ウェブストア

JPY ¥1,014
配送日にも記載のある通り、当店は海外倉庫からの出荷となります。 従いまして、ご到着までに7-21日かかりますことご了承ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,551
配送日にも記載のある通り、当店は海外倉庫からの出荷となります。 従いまして、ご到着までに7-21日かかりますことご了承ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,537
配送日にも記載のある通り、当店は海外倉庫からの出荷となります。 従いまして、ご到着までに7-21日かかりますことご了承ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,860
(中古品)Pythonによる深層強化学習入門 ChainerとOpenAI Gymではじめる強化学習 【商品説明】    Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,246
【商品名】  F-06F らくらくスマートフォン3 docomo ガラスフィルム 保護フィルム 強化ガラス 強化ガラスフィルム 液晶保護フィルム 強化ガラ   【商品説明】     【サイズ】  高さ : 0.10 cm  横幅 : 11.00 cm  奥行 : 17.70 cm  重量 : 10.0 g  ※梱包時のサイズとなります。商品自体のサイズではございませんのでご注意ください。  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,080
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。深層強化学習の入門から実装まで、この一冊でわかる!アルファ碁などのゲームAIやロボットアームの制御、自動運転などで注目されている深層強化学習の基礎と、Pythonによる実装について解説した入門書です。強化学習に適したライブラリであるChainer(ChainerRL)と、AIシミュレーション環境であるOpenAI gymを用いて解説しています。ソフトウェアシミュレーションだけでなくRaspberryPiとArduinoを用いた実環境への応用も解説しているので、ソフト・ハード問わず自身の課題に深層強化学習を応用することができるようになっています。1章 はじめに2章 深層学習3章 強化学習4章 深層強化学習5章 実環境への応用付録付録1 VirtualBoxのインストール付録2 RaspberryPiの設定付録3 Arduinoのインストール付録4 Graphical Processing Unit(GPU)の利用付録5 Intel Math Kernel Libraryを用いたNumPyのインストール  BOOK☆WALKER

JPY ¥3,608
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。強化学習、さらにディープラーニングを組み合わせた深層強化学習DQN(Deep Q-Network)という用語を目にする機会が増えています。本書は関連の概念を分かりやすく解説しつつ、Python+PyTorchで「倒立振子課題」「迷路を解くプログラム」「ブロック崩しの攻略」を実装していきます。第1章「強化学習の概要」では機械学習とその3分類(教師あり学習、教師なし学習、強化学習)について紹介します。第2章「迷路課題に強化学習を実装しよう」では、簡単な強化学習(方策勾配法、Sarsa、Q学習)のコードをひとつずつ実装しながら、強化学習のアルゴリズムと実装方法を理解します。迷路を最短ルートでゴールするよう強化学習させます。第3章「倒立振子課題に強化学習を実装しよう」では、2章で学んだ強化学習の基本をより複雑な課題へ適用します。倒立振子とは、“ほうきを手のひらの上に立てる”遊びと同じ内容でその制御ルールを強化学習させます。Anacondaを用いたセットアップ方法も解説します。第4章「Pytorchでディープラーニングを実装しよう」では、ディープラーニングの内容を理解し、PyTorchで実装します。ニューラルネットワークとディープラーニング発展の歴史、学習フェイズと推論フェイズについて解説。最後に手書き数字の画像を分類するMNIST課題を実装解説します。第5章「深層強化学習DQNを実装しよう」では、強化学習にディープラーニングを組み合わせた“深層強化学習”を理解し、DQNを実装できるようにします。第3章の倒立振子課題に対してDQNを実装します。第6章「深層強化学習の発展版を実装しよう」では、新しい深層強化学習の手法、Double-DQN、Dueling Network、Prioritized Experience Replay、そしてA3C、A2Cを理解し、実装できるようにします。第7章「AWSのGPU環境でブロック崩しを実装しよう」では、ブロック崩しゲームを対象に深層強化学習のA2Cを実装します。実行環境としてAmazonのクラウドサービスAWSのGPU環境を使用する方法も解説します。  BOOK☆WALKER

JPY ¥3,190
※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 深層強化学習は、強化学習と深層学習の組み合わせである。この研究分野の発展により、従来機械で扱う範疇ではなかった広範囲の複雑な意思決定問題を解けるようになってきた。深層強化学習はヘルスケア、ロボティクス、スマートグリッド、金融工学、その他さまざまな領域において、新たな応用の可能性を切り拓きつつある。本書は、そのような深層強化学習に関し、強化学習の基礎から始まり、深層強化学習の主要なアルゴリズムや最先端の話題まで、豊富な参考文献も含めて幅広く網羅している。特に本書は、汎化性を向上させるノウハウや深層強化学習が実応用でどのように使われるかという観点に着目して執筆されている。 機械学習の基礎知識を有する大学生・大学院生や企業の研究者・技術者が、深層強化学習の概要を効率的に勉強したいと思ったときの最初の一冊として推薦できる構成となっている。 原著:An Introduction to Deep Reinforcement Learning、 2019  紀伊國屋書店ウェブストア

JPY ¥3,190
※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。深層強化学習は、強化学習と深層学習の組み合わせである。この研究分野の発展により、従来機械で扱う範疇ではなかった広範囲の複雑な意思決定問題を解けるようになってきた。深層強化学習はヘルスケア、ロボティクス、スマートグリッド、金融工学、その他さまざまな領域において、新たな応用の可能性を切り拓きつつある。本書は、そのような深層強化学習に関し、強化学習の基礎から始まり、深層強化学習の主要なアルゴリズムや最先端の話題まで、豊富な参考文献も含めて幅広く網羅している。特に本書は、汎化性を向上させるノウハウや深層強化学習が実応用でどのように使われるかという観点に着目して執筆されている。機械学習の基礎知識を有する大学生・大学院生や企業の研究者・技術者が、深層強化学習の概要を効率的に勉強したいと思ったときの最初の一冊として推薦できる構成となっている。原著:An Introduction to Deep Reinforcement Learning、 2019  BOOK☆WALKER

JPY ¥2,860
強化学習はその定式化を用いることで幅広い実問題を表現できる一方,信頼性の不足が一因となり,実世界では応用がなされているとは言いがたい.本書は,標準的な定式化と実問題との橋渡しとなるような定式化を体系的にまとめることで,実世界での応用を促進することを目指した.【主要目次】強化学習の基礎/オフライン強化学習と資源割当問題への応用/リスク考慮型強化学習と金融への応用/安全性制約考慮型強化学習と制御系への応用  セブンネットショッピング

JPY ¥1,997
弊社は海外から直接お客様にお届けすることで、中間手数料を極限まで排除することによりこの価格を実現できております。  注文があり次第海外倉庫から取り寄せを行いますので、配送まで7日〜最大21日いただいております。 ご理解頂いた上で、ご購入ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー     Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,145
配送日にも記載のある通り、当店は海外倉庫からの出荷となります。 従いまして、ご到着までに7-21日かかりますことご了承ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー     Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,295
弊社は海外から直接お客様にお届けすることで、中間手数料を極限まで排除することによりこの価格を実現できております。  注文があり次第海外倉庫から取り寄せを行いますので、配送まで7日〜最大21日いただいております。 ご理解頂いた上で、ご購入ください。  握力強化,フィンガーストレッチャートレーナー,ハンドグリップ付きエクササイズトレーナー,ジムトレーニング,ハンドストレングスナー        Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,525
(中古品)メンタルの強化書  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,464
(中古品)これからの強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,406
(中古品)これからの強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,406
(中古品)これからの強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,413
(中古品)これからの強化学習  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,532
(中古品)心の強化書  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,186
(中古品)筋力強化の教科書  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥2,525
(中古品)メンタルの強化書  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,344
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。機械学習の代表的な理論「強化学習」の実践教科書!コンピュータ・エージェントやロボットなどの自律的な学習を実現するための計算理論である「強化学習」について、数学的背景から実装、最新の動向まで幅広く解説した本。「強化学習(Reinforcement Learning)」とは、人間や動物が持つ学習機能の一部をコンピュータで実現することを目指すコンピュータサイエンスの研究分野の一つです。強化学習の応用先は、ゲームプレイヤーの行動戦略、ロボットの動作、マーケティング戦略をコンピュータに自動的に学習させるなど、多岐に渡ります。そのため、強化学習は非常に活発に研究され、すさまじい勢いで発展しています。本書では、強化学習の基礎理論から、アルゴリズム、プログラミングによる実装、さらには応用事例まで、幅広い内容を扱っています。『本書の最大の特徴は、強化学習の数学的な理論を紹介するだけでなく、強化学習をゲームやロボット制御に応用する例を、実際にプログラミングできる形で提供しているところです。数学は得意だけどプログラミングによる実装は苦手な理論派の読者の方は、まずプログラムをダウンロードして実行してみて下さい。強化学習が秘める潜在能力を十分に堪能して頂けると思います。一方、プログラミングには興味はあるけど数学的な理論はよくわからないという応用志向の強い読者の方は、プログラムコードと平行して理論を学ぶことにより、強化学習理論の有用性を効率よく学んで頂けると思います。』(著者「まえがき」より)強化学習に関して、理論の学習と実践とを効率よく学べる構成となっています。自律ロボットやAIを学ぶ学生、戦略を学習するゲームキャラクターを作りたいプログラマーはもちろん、経験を反映するシステムを作りたい人などにも学ぶ価値のある内容となっています。  BOOK☆WALKER

JPY ¥2,090
※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。オリジナルのScratchゲームを使って楽しみながらAI・強化学習を学べる●「どんどん賢くなるAI」を3つのゲームで習得●Scratch強化ゲームの全プログラム収録●拡張モジュール不要!使うのはScratch標準機能のみ強化学習とは、AIの機械学習の一種で、簡単に言えば試行錯誤の学習です。「強化」という言葉は、動物心理学で昔から使われている用語でもあり、私たち人間や動物も強化学習をしています。赤ちゃんは自分で寝返りを覚え、ハイハイを覚え、いずれ立ち上がります。産業界では空前のAI・機械学習ブームです。2016年には、強化学習が囲碁で世界トップレベルのプロ棋士に勝つという快挙がありました。ところが、強化学習の本はあまりありません。難しい概念や見慣れない記号を使わざるを得ないので、難しく見えるからでしょう。しかし本来、強化学習のアイデア自体はシンプルで、直感的には誰にでも分かるものです。そこで、数学の知識を中学までの範囲に限定し、教育用プログラム言語のScratchで作ったゲームを題材にした入門書を作りました。本書では強化学習を3レベルに分け、レベルごとにオリジナルのScratchゲームを使いながら、それをプレイする強化学習AIをていねいに解説していきます。1章 強化学習を始めよう2章 Scratchの使い方3章 Scratchプログラムの作り方4章 レベル1・砂漠でダイヤ集めゲーム5章 レベル2・月面でダイヤ集めゲーム6章 レベル3・お化けの飛行訓練ゲーム7章 まとめ  紀伊國屋書店ウェブストア

JPY ¥2,090
オリジナルのScratchゲームを使って楽しみながらAI・強化学習を学べる●「どんどん賢くなるAI」を3つのゲームで習得●Scratch強化ゲームの全プログラム収録●拡張モジュール不要!使うのはScratch標準機能のみ強化学習とは、AIの機械学習の一種で、簡単に言えば試行錯誤の学習です。「強化」という言葉は、動物心理学で昔から使われている用語でもあり、私たち人間や動物も強化学習をしています。赤ちゃんは自分で寝返りを覚え、ハイハイを覚え、いずれ立ち上がります。産業界では空前のAI・機械学習ブームです。2016年には、強化学習が囲碁で世界トップレベルのプロ棋士に勝つという快挙がありました。ところが、強化学習の本はあまりありません。難しい概念や見慣れない記号を使わざるを得ないので、難しく見えるからでしょう。しかし本来、強化学習のアイデア自体はシンプルで、直感的には誰にでも分かるものです。そこで、数学の知識を中学までの範囲に限定し、教育用プログラム言語のScratchで作ったゲームを題材にした入門書を作りました。本書では強化学習を3レベルに分け、レベルごとにオリジナルのScratchゲームを使いながら、それをプレイする強化学習AIをていねいに解説していきます。1章 強化学習を始めよう2章 Scratchの使い方3章 Scratchプログラムの作り方4章 レベル1・砂漠でダイヤ集めゲーム5章 レベル2・月面でダイヤ集めゲーム6章 レベル3・お化けの飛行訓練ゲーム7章 まとめ  BOOK☆WALKER

JPY ¥3,740
AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。  セブンネットショッピング

JPY ¥3,740
AlphaGo(アルファ碁)でも利用されている深層強化学習。AIサービスのみならずロボティクス分野でもその応用が期待されています。本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥3,080
「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network 戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化  紀伊國屋書店ウェブストア

JPY ¥1,858
DJI Air 3 送信機 コントローラー ガラスフィルム 強化ガラス 液晶保護 HD Tempered Film 飛散防止と傷防止 グレア 光沢 保護フィルム 強化ガラス 高透過率 硬度9H 画面保護ガラス フィルム 強化ガラスシート 2枚セット  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥1,858
DJI Air 3 送信機 コントローラー ガラスフィルム 強化ガラス 液晶保護 HD Tempered Film 飛散防止と傷防止 グレア 光沢 保護フィルム 強化ガラス 高透過率 硬度9H 画面保護ガラス フィルム 強化ガラスシート 2枚セット  Yahoo!ショッピング(ヤフー ショッピング)

JPY ¥30,480
強化拡張パック カード151  Yahoo!ショッピング(ヤフー ショッピング)