AIコーディングツールが増えすぎたので、まずは調べてみた

背景

ここ数年で、ChatGPTやCopilotのような補助的なAIツールから、Devinのような自律型エージェントAIへと進化が加速しています。
私自身はまだAIツールを完全に使いこなせているわけではないため、現時点で気になっていることを整理するためにまとめました。

AIコーディングツール

まずは生成AIの三大ツールについて特徴やモデルについて調べてみました。

ChatGPT

https://openai.com/chatgpt/desktop/

私も開発のことから普段の気になったことの質問など多岐に渡って使っております。

特徴

自然言語処理に特化した大規模言語モデル
- 人間のような自然な文章の生成や理解が得意。
事前学習と微調整の二段階学習
- 膨大なテキストデータで事前学習し、特定のタスクに合わせて微調整。
文脈理解力が高い
- 長文の文脈を把握しながら、適切な返答や文章生成が可能。
多用途な応用性
- チャットボット、翻訳、要約、文章校正、コード生成など幅広く対応。

モデルについて

モデルも様々ありますがあまり使い分けができていなかったのでChatGPTに聞いてみて表にまとめました。

モデル名	特徴	推奨用途
o1	深い推論、論理的思考に優れる	数学、科学、プログラミングの問題解決
GPT-4.1	高速で精度も向上	一般的な文章生成や要約、翻訳
GPT-4.5	自然な対話、創造的なタスクに強い	文章作成、デザイン、感情に配慮した対話
o3	推論能力と視覚的解析が強化	高度なデータ分析、画像解析
o4-mini	軽量で高速な応答	日常的な数式処理、リアルタイム性が必要なタスク
o4-mini-high	高度な推論力を持つ軽量モデル	数学や科学の深掘り、複雑なアルゴリズム設計

モデルの違いは深さ・速さ・コストにあるようです。

o1やo3 → めちゃくちゃ深く考えてくれる（でもやや遅め＆計算コスト高い）
GPT-4.5 → いいバランスで自然なやり取り（でも時々思考が浅い）
mini系 → 軽い！速い！けど、ガチ相談にはやや心もとない

Gemini

https://codeassist.google/products/business?hl=ja

ChatGPTよりは使用頻度は低いですが、GoogleドキュメントやGoogleスライドの校正には重宝しています。

また、コーディングツールとは異なりますが、アップロードしたドキュメントを情報源として、ユーザーの質問に答えることができるAIツールであるNotebookLMは英語のサイトや、難しくて理解しづらい記事をNotebookLMに読ませると簡単に要約してくれるのでめちゃくちゃ便利です。

特徴

マルチモーダル対応:
- テキスト、画像、音声、動画など、複数の種類の情報をまとめて理解し、処理できる。
- それぞれの情報を組み合わせて、より高度な推論や応答が可能。
高度な推論能力と知識理解:
- 大量のデータから複雑な関係性や知識を発見できる。
- 曖昧な質問や難しい指示に対しても、より深く理解して対応できる。
長いコンテキストウィンドウ:
- 長文の要約や分析、文脈を踏まえた自然な対話に強み。
Googleエコシステムとの連携:
- Google検索やYouTubeなど、Googleの様々なサービスと連携しやすい。
- 最新情報に基づいた回答や、関連情報の提供がスムーズ。

モデルについて

モデル名	特徴	推奨用途
Gemini 2.5 Pro (プレビュー)	現時点で最も高度な推論能力。複雑なタスク、高度なコーディング、深い知識理解に優れる。マルチモーダル理解能力も向上。	研究開発、複雑な分析、高度なコーディング、クリエイティブなコンテンツ生成
Gemini 2.5 Flash (プレビュー)	複雑なタスクで高速なパフォーマンス。高度な機能を維持しつつ、応答速度が求められる用途に適している。マルチモーダル入力に対応。	リアルタイムな情報処理、チャットボット、応答速度が重要なアプリケーション
Gemini 2.0 Flash	速度と能力のバランスが取れた汎用性の高いモデル。マルチモーダル入力（テキスト、画像、動画、音声）に対応し、テキストで応答。100万トークンのコンテキストウィンドウ。	幅広いタスク（コード生成、データ抽出、テキスト編集、要約、質問応答など）、長文の処理

Claude

https://docs.anthropic.com/ja/docs/welcome

私自身Github CopilotのAIモデルとしてなんとなく性能が良い気がしてClaudeを選択していたくらいでそれ以外特に利用はしていませんでした。

特徴

安全性・倫理重視の設計
- Claudeは「憲法AI（Constitutional AI）」の原則に基づいて訓練されており、安全で倫理的な出力を重視している。
- ユーザーに対して有害・差別的な発言を極力避けるよう設計されている。
自然な対話能力
- 人間らしい丁寧な受け答えと、長文でも読みやすく整理された文章が得意。
長文処理に強い
- Claude 2以降は**最大100,000トークン（数十万文字）**もの文書を扱える能力があり、長文の読解や要約、大規模なドキュメント解析が得意。

モデルについて

モデル名	特徴	推奨用途
Claude 3.7 Sonnet	最新の推論、モデル拡張思考モード搭載、 ProアカウントでExtended Thinkingモード利用可	高度な推論、複雑な問題解決、プログラミング、AIエージェント開発、研究開発。
Claude 3 Opus	文章作成や複雑なタスクに優れたモデル	高品質な長文の執筆（論文、レポート、記事など）、複雑な創造的ライティング（物語、脚本など）
Claude 3.5 Sonnet	バランスの取れたモデル	中程度の複雑さを持つ多様なタスク、ビジネス文書の作成（メール、報告書など）
Claude 3.5 Haiku	日常的なタスクに最適化された最速モデル	迅速な応答が必要な短い質問、日常的な会話や簡単なチャット

次にコード補完型のAIコーディングツールを見ていきます。

Github Copilot

https://docs.github.com/ja/copilot

私もGithub Copilotは2,3年前くらいから使っており、コードが勝手に補完されていくのを最初見た時は大変感動したことを覚えています。2024年12月からはGithub Copilot Freeが出て個人開発でも気軽に使えるようになったのはありがたいですね。

いつの間にかGithub CopilotがPRのレビューができるようになったり、

Askモードだけでなく最近はEditモードやAgentモードが出ていたりしてきて進化がすごいです。

特徴

AIによるコード提案と補完
- GitHub Copilotは、AI（大規模言語モデル）を活用し、現在のコーディング状況や文脈を理解した上で、最適なコードを予測・提案する。単なるコード補完だけでなく、関数やコードブロック全体の生成も可能
主要なIDEとの統合
- Visual Studio Code、Visual Studio、JetBrains IDE、Neovimなど、主要な開発環境とシームレスに統合されており、エディタ内で作業が完結する。
多様なプログラミング言語に対応
- Python、JavaScript、TypeScript、Ruby、Go、C#、C++など、ほぼすべての主要プログラミング言語をサポートしている。
開発スピードと生産性の向上
- コードの自動提案や繰り返し作業の自動化により、開発効率が大幅に向上します。これにより、開発者はより創造的な作業や問題解決に集中できる。
チャット機能やCLIサポート
- コード補完だけでなく、チャットインターフェースやコマンドラインからの利用もできる。Copilot EnterpriseではPull Requestの変更説明生成や、サポート技術情報の管理も可能

各モードについて

モード	できること	使いどき
Askモード	質問して答えてもらう	ちょっとした疑問を解決したいとき
Editモード	コードのリファクタや修正提案	特定のコードを改善したいとき
Agentモード	問題発見から修正まで自動化	バグ修正や作業を丸ごと任せたいとき

Tips

Copilotの使い方としてこちらの記事も参考になりました。

https://zenn.dev/microsoft/articles/github_copilot_intro

MCP(Model Context Protocol)

MCPについてはこちらの記事がわかりやすかったので参照してください。

MCPはAIコーディングツールではないですが、ホットな話題なので触れてみました。

AIが外部サービスにアクセスするための共通ルールというのが何となくの理解ではありますが、まだまともに使ったことがなくよくわかっていないのでplaywright-mcpをとりあえず実際に試してみました。

用意するものはVS CodeとGithub Copilot Agentだけです。

playwright-mcpライブラリをインストール

npm install -g @playwright/mcp

VS Codeのterminal上で↓のコマンドを入力

code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'

これでsettings.jsonを見るとplaywright-mcpの設定が追加されています。

{  
 ...  
 "mcp": {  
		"servers": {  
			"playwright": {  
				"command": "npx",  
				"args": [  
					"@playwright/mcp@latest"  
				]  
			}  
		}  
	}  
}

VS CodeのGithub Copilotを開き、Agentモードにします。(設定直後はmcpの設定を読み込むために⚒️アイコンを一回押す必要がありそうです)

これだけでplaywright-mcpを使う準備が完了しました。色々イベントが用意されていますがスクショを撮って欲しくないとかであれば、browser_snapshotからチェックを外せばそのイベントは実行されなくなります。

あとは実際にGithun Copilotにブラウザを操作してもらいます

テスト中はChromiumが立ち上がり、ここまでの内容を一瞬でまとめてくれました。再現性が確認できれば、今後のE2Eテストが凄く楽になりそうですね。

次にエージェント型コーディングツールを見ていきます。

Cline

https://docs.cline.bot/

多少検証で使ってみましたが、エラーが多くてタスクの実行に時間がかかる印象です、私の指示の仕方が悪いのでしょうか、あと実行するたびに課金されていく感じが辛い。。。

とにかく使いこなすには少し時間がかかりそうだなと思いました。

特徴

多様な作業の自動化と支援
- コードの自動生成・修正、ターミナルコマンドの提案・実行、ブラウザ操作、プロジェクト構造の解析、エラー修正など、開発に必要な幅広い作業をAIエージェントに依頼できる。これによってChatGPTなどの外部サービスとの往復が不要になる。
過去のコード復元機能
- Gitのコミットやブランチのように、特定時点のコード状態を保存・復元できます。これにより、エラー発生時ややり直しが必要な場合も、迅速に以前の状態へ戻せる。
複数AIモデル・APIプロバイダーへの対応
- GPT、Claude、Gemini、DeepSeek、AWS Bedrock、GCP Vertex、Ollamaなど、主要なAIモデルやAPIプロバイダーと連携可能。OpenRouterを介して複数モデルを柔軟に切り替えられ、目的やコストに応じて最適なモデル選択ができる。
高いカスタマイズ性と拡張性
- オープンソースで提供されており、ユーザー独自のルールやプロファイル（モード）設定、エージェントの性格付けなど、細かなカスタマイズが可能。また、MCPを活用してJiraやAWS管理などのカスタムツールを統合し、独自の開発フローを構築できる。
リアルタイムのリソース管理
- トークン使用量やAPIコストをリアルタイムで追跡でき、効率的なリソース管理が可能
導入・運用の手軽さ
- VS Codeなどの拡張機能として簡単に導入でき、AIエージェントに慣れていない開発者でも扱いやすい設計である。

Devin

https://docs.devin.ai/work-with-devin/devin-ide

こちらも軽く2-3日検証しただけなのでまだわかっていないことは多いですが、Githubのissueを投げて、修正してPRを上げるところまで自動でやってくれたり、コード内のTODOコメントからissueを作成してもらったりなど完全に自律して作業をやってくれます。

ただ、まだデザイン系の修正は弱い印象があります。

特徴

高度なAIによる自律開発支援
- Devinは、AIが開発者の意図や文脈を理解し、自然言語での指示からコード生成、修正、デバッグ、最適化まで一貫して実行する。バグ修正やコードの最適化も自動で行い、開発プロセス全体の効率化を実現する
マルチタスク・並列処理
- Devin 2.0では、複数のAIエージェント（Devin）を同時に立ち上げて、それぞれ異なるタスクを並行して進めることが可能。例えば、API実装・フロントエンド開発・テスト作成などを同時に任せることができる。
柔軟な依頼方法と連携
- SlackやGitHubのPRコメント、Devin専用UIなど、さまざまな方法で作業依頼ができ、進捗や修正指示も手軽に行える。VS CodeやCursorなどのエディタとも連携し、普段の開発環境から直接Devinを呼び出して作業を依頼できる。
リアルタイムなコードレビューと最適化
- コードの品質分析や自動リファクタリング、コメント生成などもAIが担当し、開発者の生産性向上とコード品質の向上に貢献する。

最後にコーディングツールとは少し違いますがAIエディタについても触れていきます。

Cursor

https://docs.cursor.com/get-started/welcome

AIが標準搭載されているエディタだと言うことだけ知っていました、実際にどういうものなのかわかっていなかったのでインストールしてみました。

既存のVSCodeプロジェクトを簡単にインポートでき、かなりVS Codeと同じように使えるため使い勝手はかなり良いです。

Cursorの詳しい機能についてはこちらの記事が参考になりました。

使える機能はほとんどGIthub Copilotと同じですがいくつか違うところもあります。

Github Copilotと違うところ

Docs
- AIは学習時点までの知識しか持っていないが、Docs機能を使えば、Next.jsやSupabaseなどの公式ドキュメントの最新バージョンをAIが直接参照できる。これにより、古い情報や誤解に基づく回答を減らし、常に最新の仕様や推奨設定に沿ったアドバイスが得られる。
Auto-Debug
- コードのエラーやバグをAIが自動で検出し、修正案を提示する。エラー発生時に迅速な原因特定と修正ができ、デバッグ作業の効率が大幅に向上する

Windsurf

https://docs.windsurf.com/windsurf/getting-started

WindsurfもCursor同様AI標準搭載エディタで、ちょっと試した限りの使い勝手はVS CodeやCursorと特に変わらなかったです。

Github CopilotやCursorにはない特徴

プロジェクト全体の自動理解
- Windsurfは、プロジェクト全体をAIが自動でスキャンし、ファイルやコンポーネントの関連性を把握した上でコード提案や修正を行うのが最大の特徴。個別ファイルの指定が不要で、チャットを通じて自然言語で指示するだけで複数ファイルにまたがる修正や新機能追加もサポートする。
Cascade（AIエージェント）機能

「Cascade」と呼ばれる独自のAIエージェント機能があり、プロジェクト全体を理解しながら自律的に作業を進めることができる。
コストパフォーマンス

基本機能は無料プランでも制限なく使え、有料プランも他サービスに比べて安価

確かにCursorやWindsurfには両方便利な機能がありますが、Github Copilotでもいくつかは今後対応してくれるだろうし、わざわざ乗り越えてまで使うほどではないのかなというのが個人的な感想です。🤔

まとめ

まだ他にもAIツールはたくさんありますが、自分が気になったものを中心に、特徴をまとめたり実際に触れてみることで、徐々に理解を深めることができました。以前は、AIの急速な進化に恐怖を感じ、自分の仕事がなくなるのではないかと不安になったこともありました。しかし、何もしないよりもAIを積極的に活用することで、今後の競争力や成長に繋がる可能性が高いと感じるようになり、これからも使いこなしていきたいと思っています。

ここまで読んでいただき、ありがとうございました。