「全文検索」と「キーワード検索」を選択することができます。「平成・令和」ではあらかじめ「全文検索」にチェックが入っています。
「平成・令和」には、見出しと記事本文のデジタル文字データがありますので、これらを対象とした全文検索ができます。
また、各記事には平均80~90語のキーワードが登録されています。
キーワードには見出しと記事の冒頭から400字以内に出てくる言葉(主に名詞)が登録されるほか、同義語・類義語・略語、ひらがな・カタカナの読みなども登録されています。
検索語入力欄に打ち込んだ言葉と一致する文字列があるかどうかを、見出しや記事本文を対象に検索します。
検索対象が見出しおよび記事全体なのでヒット数は多くなります。その反面、文字の並びによっては関係のない記事がヒットすることがあります。
例)「京都」で検索 → 「東京都」もヒットしてしまう
検索語入力欄に打ち込んだ言葉と一致する文字列は見出し・記事中で赤字表示されます。
文や句など「てにをは」を含む比較的長い言葉で検索する場合には、全文検索が向いています。
例えば、「全勝を守った」という表現でも検索することができます。キーワード検索では「守った」というような言葉(主に動詞など)は登録されておらず、また「全勝」というキーワードで検索すると、「全勝はいなくなった」という文字列を含む記事もヒットしてしまいます。
一方で、全文検索で「衆院」で検索した場合、「衆議院」のように同義の言葉であっても、文字の並びが異なるものは、ヒットしません。 また書物の「本」で検索すると、「日本」「本紙」「山本」「本町」などの「本」の部分で一致したものもヒットしてしまいます。
漢字の標準字体と主な異体字のうち登録された約500字については全文検索、キーワード検索ともにどちらの字を使ってもヒットします。
例)芥川竜之介⇔芥川龍之介 長嶋茂雄⇔長島茂雄 付属⇔附属
漢字には同じ字でありながら字体が異なるものがあります。たとえば常用漢字の「鉄」には以下のような異体字があります。
例)鉄(常用漢字=新字体) 鐵(旧字) 鐡(俗字) 銕(古字)
全文検索方式では基本的には検索語入力欄に打ち込んだとおりの文字列を見出し・記事本文に持つ記事しかヒットしません。
しかし「言葉の揺らぎ(表記の多様性)を含めて検索」にチェックを入れて検索すると、表記が異なる同義語も含めてヒットさせることができます。
例)東日本巨大地震⇔東日本大震災 南沙諸島⇔スプラトリー諸島
醤油⇔しょうゆ ギョーザ⇔餃子 砒素⇔ヒ素
キオスク⇔キヨスク ココナツ⇔ココナッツ ビアホール⇔ビヤホール
ヴァチカン⇔バチカン ガンディー⇔ガンジー シェークスピア⇔シェイクスピア
ベーブ・ルース⇔ベーブルース エビスビール⇔ヱビスビール
注)キーワード検索方式ではこの機能は常に働いています。
検索語入力欄に打ち込んだ言葉と完全一致する言葉があるかどうかを、記事ごとに登録されているキーワードを対象に検索します。
ヒット数は一般的に全文検索より少なくなりますが関係のない記事を拾いません。
また、記事に出てこない言葉で検索しても、目的の記事が見つけられます。
例えば、アメリカを検索する場合、「アメリカ」「米国」「米」「USA」のどの言葉を入力しても、アメリカ関連の記事を検索できます。また、検索語入力欄に「本」と打ち込むだけで、「児童書」「新刊書」「文庫本」などの言葉を含む記事も自動的に探してくれます。これはキーワードが登録されるとき、「ヨミダス用語辞書」に登録されている同義語・類義語・略語なども自動的に追加されるからです。
また、データベース編集担当者は、記事中に含まれていない言葉でも検索する上で必要不可欠な言葉があれば適宜、キーワードとして登録しています。
ヨミダス用語辞書は、ヨミダス歴史館の中に搭載されている辞書ではなく、データベースにキーワードを登録するときに働いて、同義語・類語義・略語などをキーワードとして追加させる辞書です。
記事中に出てこない言葉もキーワードとして登録することで、新聞で使われる言葉とデータベース利用者が思い浮かべる検索語とのすれ違いを小さくし、記事のヒット率を向上させる働きをしています。
例えば、「1日午後、東京都○○市、農業△△さん(74)方から出火、木造平屋建て住宅と、隣接する土蔵2棟の計3棟340平方メートルを全焼した」という火事の記事には、肝心の「火事」という言葉が出てきません。見出しや記事中の言葉だけを検索語とする全文検索では、「火事」という言葉で検索しても、この記事はヒットしないことになります。しかしキーワード検索方式では「火事」や「火災」のようなキーワードも登録されているので記事を探し出すことができます。
キーワード検索方式の場合、通常は検索語入力欄に打ち込んだ文字列と完全一致するキーワードを検索しますが、*(全角、半角アスタリスク)をワイルドカードとして指定することにより、キーワードの前方一致、中間一致、後方一致の各検索を行うことができます。
ワイルドカードは検索文字列の先頭、末尾、前後に指定することができます。
例)前方一致指定 : スマート*
→「スマートコミュニティー」「スマートフォン」「スマートグリッド」などがヒット
後方一致指定 : *検定
→「漢字検定」「昭和史検定」「大阪検定」「鎌倉検定」などがヒット
中間一致指定 : *色発光*
→「青色発光ダイオード」「緑色発光ダイオード」などがヒット
キーワード検索方式では、キーワードの読みがカタカナ、ひらがなとも登録されているため、どちらからでも検索することができます。読みはわかっていても漢字に自信がない場合などに便利です。
例)普天間 ふてんま フテンマ
草ナギ剛 くさなぎつよし クサナギツヨシ
*「彅」はデータベースでは使えない漢字なのでカタカナで表記してあります。新聞紙面では「草彅剛」です。