powerpoint-automation

AI-powered PPTX generation from web articles, blog posts, and existing presentations. Converts web content and existing PPTX files into structured presentations using an Orchestrator-Workers pipeline with content.json as the canonical intermediate format Supports translation (English ↔ Japanese), custom templates with multiple layouts, and quality review via dedicated agents Includes 5+ utility scripts for content extraction, template analysis, schema validation, and text overflow detection Provides detailed guidance on shape-based architecture diagrams, hyperlink batch processing, font theme resolution, section management, and safe layout modifications via XML manipulation Handles edge cases including file locking, ZIP-level deduplication, placeholder elimination, and background image preservation when editing existing presentations

INSTALLATION
npx skills add https://github.com/aktsmm/agent-skills --skill powerpoint-automation
Run in your project or agent environment. Adjust flags if your CLI version differs.

SKILL.md

PowerPoint Automation

AI-powered PPTX generation using Orchestrator-Workers pattern.

When to Use

  • Web 記事やブログをスライド化したいとき
  • 既存 PPTX を翻訳・再構成したいとき
  • 開いている PPTX を COM Automation で直接編集したいとき
  • テンプレートベースで PPTX を生成したいとき
  • content.json を SSOT にして、抽出・翻訳・生成・レビューを分離したいとき

Quick Start

From Web Article

Create a 15-slide presentation from: https://zenn.dev/example/article

From Existing PPTX

Translate this presentation to Japanese: input/presentation.pptx

Edit Open PPTX with COM

Edit the currently open PowerPoint deck with COM Automation and verify RefURL, notes, overflow, and hyperlinks.

Workflow

TRIAGE → PLAN → PREPARE_TEMPLATE → EXTRACT → TRANSLATE → BUILD → REVIEW → DONE

Phase

Main Actor

Purpose

EXTRACT

extract_images.py

Source -> content.json

BUILD

create_from_template.py

content.json -> PPTX

REVIEW

PPTX Reviewer

Overflow / consistency / quality

Core Assets

Scripts

Script

Purpose

create_from_template.py

content.json から PPTX を生成するメインスクリプト

reconstruct_analyzer.py

既存 PPTX を content.json に戻す

extract_images.py

PPTX / Web から画像を抽出する

validate_content.py

content.json のスキーマ検証

validate_pptx.py

overflow などの検証

詳細は references/SCRIPTS.md を参照。

content.json

content.json はこの skill の SSOT。抽出、翻訳、生成、レビューの間は常にこれを基準にする。

{

  "slides": [

    { "type": "title", "title": "Title", "subtitle": "Sub" },

    { "type": "content", "title": "Topic", "items": ["Point 1"] }

  ]

}

スキーマ詳細は references/schemas/content.schema.json を参照。

Template

標準テンプレートは assets/template.pptx。レイアウトや用途の詳細は template 側で管理し、main SKILL には最小限だけ残す。

python scripts/create_from_template.py assets/template.pptx content.json output.pptx --config assets/template_layouts.json

Agents

Agent

Purpose

Orchestrator

Pipeline coordination

Localizer

Translation (EN <-> JA)

PPTX Reviewer

Final quality check

定義詳細は references/agents/ を参照。

Operating Rules

  • SSOT: content.json を正とする
  • One phase, one purpose: 抽出・翻訳・生成・レビューを混ぜない
  • Fail fast: 問題が出たら次フェーズへ無理に進めない
  • Human in loop: PLAN でユーザー確認を入れる
  • Technical content is verified content: Azure / Microsoft の内容は MCP で一次情報確認してから入れる
  • PowerPoint lock first: 開いている PPTX に対して python-pptx で上書きしない
  • Operational text stays in notes: 運営メモはスライド面に出さない
  • Architecture diagrams use shapes: ASCII art ではなく図形で組む
  • Appendix URLs use Title - URL: 参考 URL の表示形式は統一する

Reference Map

Frequently Needed

Go to Implementation Patterns For

  • technical content verification workflow
  • shape-based architecture diagrams
  • hyperlink batch processing
  • font theme token resolution
  • section / layout XML manipulation
  • hidden slide cleanup
  • COM Automation editing rules
  • RefURL placement and hyperlink auditing
  • file-lock workaround and post-processing
  • 16:9 centering issues
  • template corruption recovery
  • video embedding via ZIP direct manipulation

Done Criteria

  • source と goal が固定されている
  • content.json を正として各フェーズが分離されている
  • template / layout の前提が確認できている
  • technical content は一次情報確認が済んでいる
  • operational text がスライド面に出ていない
  • build 後に overflow / consistency / hyperlink をレビューできている
BrowserAct

Let your agent run on any real-world website

Bypass CAPTCHA & anti-bot for free. Start local, scale to cloud.

Explore BrowserAct Skills →

Stop writing automation&scrapers

Install the CLI. Run your first Skill in 30 seconds. Scale when you're ready.

Start free
free · no credit card