
この記事では、実際に使えるAIツール/AIサービスに絞り、2026年5〜6月に登場・提供開始・大型アップデートされたものを中心に紹介する。
仕事や制作の中に組み込めるツールとして、どこに価値があるのかを見ていきたい。
Runway Agentは、動画生成AIが次の段階へ入ったことを分かりやすく示すツールだ。
これまでの動画生成AIは、プロンプトを入力し、数秒から数十秒の映像を作る体験が中心だった。
もちろん、それだけでも十分に大きな変化だったが、実際の制作現場では映像を一つ出すだけでは足りない。
企画を考え、構成を詰め、シーンを分け、必要に応じてナレーションや音楽を加え、最終的に使える動画へ整える必要がある。
Runway Agentが目指しているのは、まさにその制作工程への入り込みだ。
ユーザーが作りたい動画の方向性を伝えると、AIエージェントがコンセプトやストーリー構成を提案し、対話しながらブラッシュアップしていく。
単発の映像を生成して終わるのではなく、複数のシーンを並行して作り、必要に応じて編集まで進める。
動画制作を「生成」だけで捉えるのではなく、制作プロセス全体へAIを置く発想に近い。
この変化は、クリエイターだけの話ではない。
企業のSNS運用、広告制作、採用広報、商品紹介、教育コンテンツでも、動画はますます重要になっている。
だが、企画から編集までを毎回外注するにはコストがかかり、社内で作るにはノウハウが必要になる。
Runway Agentのようなツールは、その中間にある負担をかなり軽くする可能性がある。
動画生成AIは、もう「動く絵を作るAI」ではなくなりつつある。
Runway Agentは、AIが企画会議や編集机の近くに座り始めたことを感じさせるツールだ。
Shortifyは、ショート動画を作りたい中小企業や個人事業主にかなり近いAIツールだ。
TikTok、Instagramリール、YouTubeショートは、いまや大企業だけの広告チャネルではない。
飲食店、美容室、整体院、スクール、士業、地域店舗、個人ブランドでも、短い動画が集客の入口になる。
ただ、実際に続けようとするとすぐに壁にぶつかる。何を撮ればよいのか分からない。台本が作れない。
編集に時間がかかる。外注すると費用が重い。結果として、動画をやらなければと思いながら更新が止まってしまう。
Shortifyが狙っているのは、まさにその詰まりだ。
テキストで目的や内容を入れると、脚本、絵コンテ、映像、ナレーション、BGMまで含めてショート動画の制作を支援する。
動画編集ソフトを使いこなす人のためというより、そもそも動画制作を日常業務の中に組み込めていない人に向いている。
ここで面白いのは、Shortifyが「AI動画生成」というより「SNS発信の自動化基盤」に近いことだ。
生成AIの世界では、高品質な映像モデルが注目されやすい。
しかし、店舗や小規模事業者にとって本当に必要なのは、最先端の映像表現だけではない。
毎週発信できること。商品やサービスの魅力を分かりやすく見せること。
専門知識がなくても、動画を集客の導線に置けること。
その現実的なニーズに寄せている点で、Shortifyは見逃せない。
動画制作は、プロだけの仕事ではなくなってきた。
Shortifyのようなツールが広がれば、SNSに動画を出すことは、ブログを書くことやチラシを作ることに近い日常業務へ変わっていく。
アド.com AI Workspaceの動画生成AIアップデートは、AI動画が広告運用の現場へ近づいていることを示している。
動画生成AIは、見栄えのよい映像を作れるだけでは広告にはならない。
広告では、人物や商品の見た目がシーンごとにぶれないこと、参照素材を反映できること、複数パターンを素早く作れること、訴求ごとに素材を変えられることが重要になる。
AIで映像は作れたが、広告素材としては使いにくいという課題は、これまでかなり大きかった。
今回のアップデートでは、登場人物や商品の一貫性を保った複数シーンの連続生成、複数の参照素材をまとめて反映する機能、日本語の音声やリップシンクの改善などが打ち出されている。
これは単に動画の品質が上がったというより、広告クリエイティブとして使うための条件に寄せてきた動きだ。
広告運用では、ひとつの完璧な動画を作るより、複数の切り口を早く試すことが成果につながる場面も多い。
たとえば、同じ商品でも「価格訴求」「悩み解決」「使用シーン」「比較」「お客様の声」では作るべき動画が変わる。
従来なら企画、撮影、編集、修正に時間がかかったが、AI Workspaceのような環境なら、素材制作の試行回数を増やしやすくなる。
AI動画生成が広告に入ると、クリエイティブ制作の考え方も変わる。
一本を丁寧に作るだけでなく、仮説に合わせて動画を作り分ける。
広告リサーチ、素材生成、運用改善がつながれば、AIは単なる制作補助ではなく、マーケティングの実験速度を上げる道具になる。
Omakase AIアバターは、AIアバターが「動画で説明する存在」から「人と対話する存在」へ近づいていることを感じさせる。
これまでのAIアバターは、研修動画や案内動画のように、あらかじめ決められた内容を話す用途が中心だった。
表情や声が自然になり、見た目の品質も上がったが、基本的には一方向の情報伝達に近い。視聴者が何かを聞き返したり、相談したり、状況に応じて返答が変わる体験とは距離があった。
Omakase AIアバターが打ち出しているのは、その双方向性だ。
人物の知識、経験、話し方、人柄をもとにAIアバターを作り、ユーザーとリアルタイムに対話する。
採用担当者、ブランドスタッフ、専門人材、営業担当、カウンセラーのように、コミュニケーションそのものが価値になる領域で使うことを想定している。
この方向性は、AI接客の見え方を変える。
単に問い合わせを減らすための自動応答ではなく、企業やブランドの顔として、相手に合わせた対話体験を作る。
採用なら候補者が企業理解を深める入口になり、美容や教育なら個別相談のハードルを下げられる。営業やカウンセリングでは、最初の接点を24時間開いておくことも可能になる。
もちろん、人の対話をすべて置き換えるものではない。
むしろ、初期対応や説明、相談の入口をAIが担い、人間はより深い判断や関係構築に集中する使い方が現実的だ。
Omakase AIアバターは、AIが企業のコミュニケーションを拡張する流れをかなり分かりやすく示している。
HITOは、受付や案内業務にAIバーチャルヒューマンが入っていく流れを象徴するツールだ。
施設案内、多言語接客、FAQ対応。こうした業務は、表面だけを見ると単純に見えるかもしれない。
だが実際には、人手不足、対応品質のばらつき、インバウンド対応、営業時間外の案内、現場スタッフの負担といった問題が重なっている。
ホテル、商業施設、交通機関、医療機関、展示施設では、問い合わせ対応だけでかなりの時間が削られる。
HITOは、リアルタイムの音声AIを使い、バーチャルヒューマンが来訪者と自然に会話する設計になっている。
単なるチャットボットではなく、企業や施設の顔として、ビジュアルや話し方をブランドに合わせられる点も特徴だ。
ここで注目したいのは、AIが「裏側の効率化」ではなく「来訪者が直接触れる体験」に出てきていることだ。
多くの業務AIは、社内で文書を要約したり、メールを下書きしたり、分析を補助したりする。
HITOのようなツールは、それとは違う。受付、案内、説明といった、人とサービスが最初に出会う場所へAIを置く。
うまく設計できれば、スタッフの負担を減らしながら、問い合わせ対応の質を一定に保てる。
特に多言語対応では、AIの意味が大きい。
外国語を話せるスタッフを常時配置できない施設でも、基本的な案内やFAQならAIが支援できる。
人手不足と訪日客対応が重なる現場では、HITOのようなAIバーチャルヒューマンはかなり現実的な選択肢になり得る。
PIP-Makerの資料AI翻訳は、資料の翻訳と動画化をつなぐ点で興味深い。
企業には、すでに大量のPowerPoint資料がある。研修資料、営業資料、製品説明、マニュアル、社内ルール、セミナー資料。
だが、それらを多言語で展開しようとすると、翻訳、レイアウト調整、ナレーション、動画化の工程が重い。
文章だけ翻訳しても、スライドの文字量が崩れたり、話し言葉として不自然になったりする。
資料AI翻訳が扱うのは、そこにある面倒さだ。
PowerPoint資料をもとに、スライド上のテキストとプレゼンターのセリフを分けて翻訳し、文脈や文化背景まで考慮した表現へ整える。
さらに、PIP-Maker自体がPowerPoint資料をアバター付き動画へ変えるサービスであるため、翻訳された資料をそのまま多言語動画コンテンツとして展開しやすい。
この方向性は、日本企業の実務にかなり近い。
海外拠点への研修、外国人スタッフ向けの教育、製品説明の多言語化、販売代理店向け資料、社内ルールの共有。
どれも必要性は高いが、人手で行うには時間がかかる。しかも、単に直訳すればよいわけではない。
相手に伝わる言葉に直し、視聴しやすい形に整える必要がある。
PIP-Makerの資料AI翻訳は、AI翻訳を「文章の置き換え」から「伝わる資料展開」へ近づけている。
グローバル対応というと大企業向けに聞こえるが、実際には中堅企業や教育機関、医療・製造・サービス業でも需要は大きい。
社内に眠っているPowerPointを多言語動画へ変えられるなら、AIは翻訳ツールではなく、ナレッジ展開の道具になる。
Kai for RAD Studioは、AI開発支援が最新のWeb開発だけに閉じていないことを示すツールだ。
AIコーディングツールというと、Python、JavaScript、TypeScript、React、Next.jsのようなモダンな開発環境を思い浮かべる人が多い。
だが、実際の企業システムには、長く使われてきた業務アプリやデスクトップアプリが残っている。
DelphiやC++Builderで作られたシステムも、その一部だ。こうした領域では、新規開発よりも保守、改修、モダナイズの負担が大きい。
Kaiは、RAD StudioのIDEに統合されるAIエージェントプラグインとして、Delphi / C++Builderの開発を支援する。
特徴は、単にチャットでコードを提案するだけではない点にある。
プロジェクトの文脈を理解し、コード生成、UI生成、コンパイル、エラー修正、ファイル操作までIDE内で支援する。
汎用AIにコードを貼り付けて相談するのではなく、開発環境の中でAIが直接作業に関わる形だ。
これは、業務アプリ開発ではかなり重要になる。
既存システムの保守では、コードの全体像を理解し、ライブラリやフレームワークの作法に沿って修正する必要がある。
RAD Studio特有のVCL、FireMonkey、FireDACのような文脈を踏まえた提案ができるなら、AIは単なるコード生成ツールではなく、古い資産を扱うための補助者になる。
AI開発支援は、これから新しいアプリを作る人だけのものではない。
むしろ、多くの企業にとって重要なのは、すでに動いているシステムをどう保守し、どう少しずつ現代化するかだ。
Kaiは、その現実的な領域にAIが入り始めた例として注目できる。
Dify Essential / Dify Standardは、AIアプリを自社で作る流れをかなり現実的にする。
Dify自体は、ノーコード/ローコードでAIアプリやAIエージェントを構築できるプラットフォームとして知られている。
チャットボット、RAG、ワークフロー、自社データを使った業務支援アプリなどを作りやすく、開発者だけでなく、業務部門の担当者にも近い存在になってきた。
今回注目したいのは、リコージャパンが2026年6月からDify Essential / Standardのライセンス提供を始めたことだ。
この動きが意味するのは、AI活用が「全社一括の大規模導入」だけではなく、部門単位や小規模チームから始める段階へ入っていることだ。
いきなり大きなAI基盤を作るのではなく、特定部門の問い合わせ対応、社内文書検索、営業資料作成、業務マニュアルの参照、申請フローの補助のように、身近な課題からAIアプリを作る。
日本企業では、この入り方の方が現実的な場合も多い。
生成AIを導入したいが、何から始めればよいか分からない。全社展開の前に、まず一部門で試したい。IT部門だけでなく、現場側にも使える形にしたい。
Dify Essential / Standardは、そうした段階的なAI活用に向いている。
さらに、リコーグループの社内実践をもとにしたテンプレート提供も重要だ。
AIアプリは、作れるだけでは定着しない。どの業務に使うか、どんな入力を想定するか、どこで人間が確認するかまで設計する必要がある。
テンプレートがあることで、企業はゼロから悩むのではなく、実用例をもとに自社向けへ調整しやすくなる。
Difyの流れは、AIを使う側から、AIを作って使う側への移行を感じさせる。
AI集患電話は、AIがかなり具体的な業務課題に入り込んだ例だ。
医療・介護、とくに訪問看護や介護事業者では、電話対応が事業の入口になる。ケアマネジャーや病院から「空きはありますか」「この利用者を受け入れられますか」と連絡が入る。
その場で答えられれば依頼につながるが、確認して折り返す間に他の事業所へ決まってしまうこともある。
これは単なる電話番の問題ではない。
新規依頼の獲得、シフトの空き状況、訪問スケジュール、受け入れ可否、地域連携、機会損失がすべてつながっている。
しかも、現場管理者が訪問中だったり、運転中だったりすると、そもそも電話に出られない。依頼を受けたいのに受けきれない構造がある。
AI集患電話は、この新規依頼電話にAIが自然な対話で応答するサービスだ。
シフトの空き状況を参照し、対応可能な日時をその場で返す。利用者の状態、保険種別、希望開始時期、エリアなど、受け入れ判断に必要な項目を聞き取る。
さらに、応対内容や問い合わせ傾向、断り理由、機会損失をデータ化し、経営判断に使える形へ残す。
ここが面白い。
AI電話対応というと、予約受付や問い合わせ削減を思い浮かべる人が多い。AI集患電話は、それよりも事業運営に近い。
電話を受けること自体が目的ではなく、依頼を取りこぼさず、現場の空き状況と結びつけ、属人化していた集患の実態を見えるようにする。
AIが電話に出るだけではない。
電話で発生していた見えない損失を、経営のデータへ変える。この視点は、今後の業務AIを考えるうえでかなり重要になる。
OpenAI Codex Sitesは、AI開発がエンジニアだけのものではなくなっていく流れの中で捉えたい。
Codexは、コード生成や開発支援の文脈で語られることが多い。
だが、OpenAIが示している方向は、単にエンジニアの生産性を高めるだけではない。
Codexを、職種ごとのツールやワークフローに接続し、コーディングの専門知識がない人でも、必要な成果物を作れるようにする方向へ広げている。
その中で、WebサイトやWebアプリをAIで作り、共有する体験はかなり重要になる。
これまでWeb制作は、企画、デザイン、実装、公開の間にいくつもの壁があった。個人事業主がLPを作る。
メディア運営者が簡単なツールページを作る。企画担当者が社内向けのミニアプリを作る。こうした用途では、本格的な開発チームを組むほどではないが、ノーコードツールだけでは足りない場面もある。
Codex Sitesのような方向性は、その隙間に入ってくる。
プロンプトで要件を伝え、AIがコードやUIを作り、必要に応じて修正し、共有できる形にする。
完全なプロダクト開発を置き換えるものではないが、アイデアを形にする初速は大きく変わる。
とくに、企画者、マーケター、個人事業主、メディア運営者にとっては、Web制作がより手元に近づく。
この変化は、開発者の役割をなくすものではない。
むしろ、開発者はより複雑な設計や品質管理へ向かい、非エンジニアは小さなWeb体験を自分で作れるようになる。
AIがコードを書く時代に重要になるのは、何を作るべきか、どこまで自分で作り、どこから専門家に任せるかという判断だ。
Codex Sitesは、AI開発の民主化をかなり分かりやすく見せる存在になる。
Google Workspace Studioは、日常業務の中にAIエージェントを置くためのツールだ。
Gmail、Google Drive、Google Chat、Docs、Sheets、Slides。
多くの企業では、すでにこれらのツールが仕事の中心になっている。
メールが届き、ファイルが保存され、チャットで依頼が飛び、スプレッドシートに数字が入り、資料が作られる。
業務の多くは、実はこうしたアプリの間を人間が行き来することで成り立っている。
Workspace Studioが狙うのは、その行き来の一部をAIエージェントに任せることだ。
たとえば、Gmailに届いた問い合わせを分類し、Drive内の資料を参照し、Chatへ通知し、必要に応じてDocsやSheetsへ整理する。
これまで人が何度も繰り返していた定型作業を、Google Workspaceの中で自動化する。
ノーコードでAIエージェントやワークフローを設計できる点も、業務部門にとっては大きい。
ここで重要なのは、AIが別アプリとして存在するのではなく、普段使っている業務環境の中に入ることだ。
多くのAIツールは便利でも、別画面を開き、コピーし、貼り付け、また戻る必要がある。
Workspace Studioのような仕組みでは、仕事が発生する場所にAIを置ける。
GmailやDriveの文脈を保ったまま、AIに処理を進めさせる発想に近い。
もちろん、権限管理やデータ保護は慎重に見る必要がある。
AIエージェントが社内情報に触れるほど、誰がどの情報にアクセスできるのか、どこまで自動化してよいのかが重要になる。
その点で、Google Workspace内の権限や管理機能と連動することは、企業導入では大きな意味を持つ。
Workspace Studioは、AIを「聞く相手」から「動く業務フロー」へ変えるツールだ。
ElevenLabs Dubbing v2とMusic v2は、音声AIがコンテンツ制作のかなり実用的な領域へ進んでいることを示している。
Dubbing v2は、動画の吹き替えにおいて、元の話者の感情、間、話し方、トーンを別言語へ移すことを目指している。
従来のAI吹き替えでは、翻訳としては合っていても、話し方が平板になりやすかった。
人間の声には、言葉そのもの以上に、ためらい、強調、テンポ、熱量が含まれる。
Dubbing v2は、その演技や表現を多言語へ持ち越そうとしている。
これは、動画制作者や教育事業者にとってかなり大きい。
YouTube、オンライン講座、企業研修、プロダクト紹介、広告動画、ポッドキャスト。
海外へ届けたいコンテンツは多いが、自然な吹き替えにはコストがかかる。
AIで翻訳音声を付けるだけなら以前からできたが、視聴者が違和感なく聞ける品質まで近づくと、コンテンツの展開先は一気に広がる。
Music v2も同じ流れにある。
ボーカル、楽器、アレンジ、ジャンル転換、多言語生成などが強化され、広告、動画、ブランドコンテンツ、アプリ、ゲーム、教材などの音楽制作に使いやすくなっている。
AI音楽は著作権や権利処理の議論が欠かせない領域だが、商用利用を前提にした設計が進むことで、企業やクリエイターが扱いやすい環境も整ってきた。
音声は、AI活用の中でもかなり身近な領域だ。
動画にナレーションを入れる。教材を多言語化する。広告にBGMを付ける。ポッドキャストを別言語へ届ける。
ElevenLabsの進化は、制作物の「聞こえ方」をAIが支える時代に入ったことを感じさせる。
Figma Makeの価値は、デザインとプロトタイプ制作の距離を縮める点にある。
これまで、新しいWebサービスやアプリのアイデアを形にするには、企画者、デザイナー、エンジニアの間で何度もやり取りが必要だった。
企画書で説明し、ワイヤーフレームを作り、デザインへ起こし、必要ならプロトタイプ化する。
その過程で、アイデアの熱量が落ちたり、細かな意図が伝わらなかったりすることも多い。
Figma Makeは、プロンプトや既存デザインから、動くプロトタイプに近いものを作る。
これは、デザイナーを不要にするという話ではない。むしろ、企画段階の曖昧なアイデアを早く可視化し、チームで議論できる形にするための道具だ。
マーケターがキャンペーンページの案を作る。PdMが新機能の画面を試す。デザイナーが初期案を広げる。
エンジニアが実装前に動き方を確認する。そうした場面で、Figma Makeは会話の速度を上げる。
AI時代のデザインでは、完成形を一発で作ることより、試す回数を増やすことが重要になる。
Figma Makeのようなツールが広がると、アイデアは文章のまま止まらず、すぐに触れる形へ変わる。
企画、デザイン、開発の境界が少しずつ溶けていく中で、プロトタイプを素早く作れるAIは、チームの共通言語になっていく。
今回取り上げたツールを並べると、2026年のAI活用がどこへ向かっているのかが見えてくる。
・AIがコンテンツ制作の入口から出口まで入り始めたこと。
・顧客接点に立ち始めたAIも増えてきました。
これから必要になるのは、流行っているAIを片っ端から試すことではない。
重要なのは、自分の仕事のどこにAIを置くと、流れが変わるのかを見極めることだ。
動画制作の手前に置くのか、広告運用の素材制作に置くのか、電話対応に置くのか、社内資料の翻訳に置くのか、開発環境に置くのか、意思決定の前段階に置くのか。
AI活用が進む企業や個人は、AIを魔法の箱として見るのではなく、仕事の部品として扱い始めている。
・時間がかかっている作業はどこか。
・人に依存している対応はどこか。
・外注費が重い制作はどこか。
・情報があるのに判断へつながっていない場所はどこか。
そこが見えれば、AIツールはただの流行ではなく、具体的な選択肢になる。

