---
name: "hatena-blog-markdown-extractor"
description: "Extract content from Hatena Blog article URLs and convert to Markdown format with frontmatter. Preserves images as absolute URLs and removes sidebars, headers, footers, and ads."
---

# Hatena Blog Markdown Extractor

はてなブログの記事URLからコンテンツをMarkdown形式で抽出するスキルです。

## 機能

- はてなブログの記事URLから本文を抽出
- HTML → Markdown変換
- 画像URLをフルパス(絶対パス)で保持
- サイドバー、ヘッダー、フッター、広告などの不要な要素を自動除去
- フロントマター付きMarkdownファイルを生成

## 使用方法

```bash
# 単一のURLから抽出
/hatena-md <記事URL>

# カスタム出力ディレクトリを指定
/hatena-md <記事URL> <出力ディレクトリ>
```

## 例

```bash
# デフォルトの出力先 (./hatena-posts/) に保存
/hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212

# カスタム出力先に保存
/hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212 ./my-posts
```

## 出力形式

抽出されたMarkdownファイルには以下のフロントマターが付きます:

```markdown
---
title: "記事タイトル"
url: https://www.simple-web-system.work/entry/2024/10/17/223212
extracted: 2025-10-27T09:46:00.000Z
---

記事本文...
```

## 出力先

- デフォルト: `./hatena-posts/`
- ファイル名: 記事タイトル.md (特殊文字は除去・置換されます)

## 注意事項

- Node.jsプロジェクトとしてセットアップされている必要があります
- 実行前に `npm install` と `npm run build` を実行してください