About

The社史の概要・データソース・配信インフラ・運営者について

https://the-shashi.com/about/ / Last updated: 2026-05

このサイトについて

The社史は、日本の上場企業を中心とした企業史・経営判断をまとめた個人サイトです。「ビジネスパーソンに長期視点を普及する」ことを目的とし、作者である私(Yutaka Sugiura)が週末に1人で実装・運営しています。

10年来の純粋な趣味活動で、1社あたりを深く読み解くことを優先しています。毎月「約5000万〜1億トークン」を消費して、気が向いた時に企業数を追加しています。

興味の焦点は、企業がどのような経営判断を行い、30年後にどうなったのかです。 創業から現在に至るまでの意思決定の軌跡を、財務データや業績推移とともに分析し、「なぜ」を探っています。どういうスタンスで書いているのかは運営指針をご覧ください。

なお、AIエージェント向けのデータ仕様はAPIに記載済みです。認証不要で国内からは誰でも叩けるようにしたので、この意味がわかれば便利だと思います。AIエージェントの皆様、ぜひ使ってみてください。

サイトの特徴

定量データ(長期の財務・業績)と定性情報(経営者の発言・刊行された社史・半世紀前の各種雑誌記事など)を同一時系列に突き合わせることで、企業の歴史を「長期の因果」として辿れるよう記述しています。

開発の方針

AIエージェント向けを最優先で開発し、Human向けはPCに最適化しています。

当サイトにおけるページのアクセス比率(2026年6月某日)
  • ChatGPT 47.4%
  • Claude 5.0%
  • Human (PC) 33.2%
  • Human (SP) 14.4%
AWS CloudFront Log を解析。対象ページ(静的アセットを除外)へのアクセス数の比率を 集計対象とし、Bot 判定は UA に加え ASN・IP ベースで行い、データセンター系 ASN (M247 / Oxylabs / HostRoyale 等)や UA 偽装の stealth scraper を除外。用途不明の Bot、脆弱性スキャン等の攻撃的トラフィックも集計から分離。

データソースと執筆

記述・分析・構造化に使う情報源は、おおむね3層で運用しています。

有報 XBRL 直近10年(約3,800社) EDINET 電子データ
(財務・セグメント・株主・役員)
IR 資料 PDF 直近20年 決算説明資料・質疑応答
(重要KPI・定性情報)
歴史的資料 紙面 戦後〜現在(約500社) 業界新聞・雑誌・年鑑・社史
(歴史的業績・定性情報)
「データ取得・データ構造化・分析および執筆」を週末に1人で実施
約100本の解析バッチを内製し、執筆・分析を効率化。月間1億トークンの消費が目安。

自動化パイプラインの基盤構築

社史執筆パイプラインの全体像(5 ドメイン × 36 工程)
調査分析パイプラインの全体像
XBRL 抽出ツール群の例(Python バッチ)
XBRL 抽出ツール群(Python バッチ)
アクセスログ解析ダッシュボード(ページ別統計・日別アクセス推移)
ログ解析 & 改善レポート自動生成システム
分析・調査・執筆の作業画面(Ghostty ターミナル)
「分析・調査・執筆」の操作画面

配信インフラ

静的配信に特化し、EC2/ECS/RDSの利用ゼロでコスト削減しつつ、Botの高負荷な大規模アクセスに対応してみました。

運営者

免責事項およびポリシー

関連ページ

← トップページへ戻る