-
苗字と名前の間は「半角空白で区切る」を採用しています。理由:
- 名前は英字の場合もあるため全角で区切るのは変。
- 区切りをなくしてしまうと、日本人の場合、どこまでが苗字かわからないケースが出てくる。
- 英字の氏名の空白をなくすのは変。
-
人に対してデータを付与することを「タグをつける」、付与したデータを「タグ」と呼んでいます。
-
タグはCSVです。
竹内先生が収集した各採択者の現在の所属のデータを流し込むために考案されたフォーマットです。 複数の人に対して複数のタグを付与することが容易なように設計されています。
?
で始まる行はコメントです。スクリプトはこの行を単に読み飛ばします。!
で始まる行は、データ入力時に何らかの要相談な問題があった場合に使うコメントです。 スクリプトを実行する前にテキスト検索して、すべての!
を解消することが想定されています。 もしスクリプトへの入力にこれが残っていた場合、スクリプトは停止します。#
で始まる行は氏名です。そこ以降、次の#
またはファイル末までが「その人の章」と解釈され その章の各行が「その人に付与すべきタグ」と解釈されます。- 所属のタグは
所属,大分類,時点,備考
という仕組みです。 - 所属の情報がわからない、正しくないかもしれない、などの公開できない人については、単純に削除してもよいですし、
氏名の冒頭に?をつけて
# ?西尾 泰和
としてもらえれば、スクリプトはその章を読み飛ばします。
例えば竹内先生にいただいたExcelファイルを元に、以下のようなフォーマットでテンプレートが出力されています。 テーマや元々書かれていた記述などの参考情報はコメントの形で
# 久池井 淳
? 美しい私をプロデュースし,美容院を産業革命させるヘアスタイルシミュレーションシステム『ViVienne(ビビアン)』の提案
? (株)ビビアン アクセンチュア OIIチーム
URL, http://it.impressbm.co.jp/articles/-/11138
URL, https://www.accenture.com/jp-ja/open-innovation-initiative-meet-the-team
# 久保 渓
? 「創造性」を共有するソーシャルウェブデザインツール
? LINE Pay(株)
URL, http://blog.webpay.co.jp/post/line-to-acquire-webpay_10feb2015
URL, http://www.cardwave.jp/user_data/news-detail.php?blog=1281
この例の中の「(株)ビビアン アクセンチュア OIIチーム」はコメントで、しかも複数の所属が混ざっています。 参考URLを確認すると「2014年3月18日」の記事で「ビビアン社長」と言及されています。 なのでこれは以下のように記載します。
所属,(株)ビビアン,2014年3月18日,社長
つぎに「アクセンチュア OIIチーム」の部分に関して、URLを確認してみましょう。残念ながら日時はわかりません。ですので次のように記載します。
所属,アクセンチュア,不明,OIIチーム
「アクセンチュアは株式会社じゃないのか」とか、 OIIチームの解説のところに「戦略コンサルティング本部」と書かれているので所属としてはこっちを記載した方が良いのではないかとか、 細かいところが気になり始めるかも知れませんが、そういうことは第三者が悩むより、本人に修正してもらった方がコストの総和が小さいので、 あまり気にせずに進めて頂いて構いません。まずは一通り終わらせて公開できる形にすることの方が優先です。
久池井さんの章は最終的にこうなります。スクリプトはこれを読み取って久池井さんのレコードに4つのタグを追加します。
# 久池井 淳
所属,(株)ビビアン,2014年3月18日,社長
所属,アクセンチュア,不明,OIIチーム
URL, http://it.impressbm.co.jp/articles/-/11138
URL, https://www.accenture.com/jp-ja/open-innovation-initiative-meet-the-team
イベントの発表プログラムは、名前と所属と「関心のあるテーマ」と日時がセットになった、とても良い情報源です。 そこでプログラミングシンポジウムのプログラムを流し込む実験を行ないました。 https://github.com/mitou/meikan/blob/master/prosym/README.md
その際のフォーマットを解説します。
##
で始まる行はイベント名称。## イベント名称 日時
もしくは## イベント名称 開始日時 ~ 終了日時
の形。#
で始まる行は講演のタイトル- 講演タイトルに続く行が講演者で、
氏名 (所属)
を,
でつないで繰り返した構造になっている
実例
## 第47回 2006-01-10 ~ 2006-01-12
# 座長
岩崎 英哉 (電通大)
# 災害時情報共有インタフェースおよびSDGミドルウエアの開発
上田 真史 (電気通信大学), 竹内 郁雄 (電気通信大学)
to see more: https://github.com/mitou/meikan/blob/master/prosym/prosym_formatted.txt
これらの情報から以下のようなタグが出力されます
所属,電気通信大学,2006-01-10,
講演,第47回プログラミングシンポジウム,災害時情報共有インタフェースおよびSDGミドルウエアの開発,2006-01-10,
このフォーマットはプログラミングシンポジウムのプログラム記述にすり寄る形で設計されており、 新しく入力する場合のフォーマットとしてはもっと良いものがあり得ると思います。