メモ帳

Windows10のメモ帳で文字コードを指定して保存をする方法

スポンサーリンク


Windows10 のメモ帳で文字コードを指定して保存する方法を解説します。

文字コードとは?

文字コードとはパソコンで文字を扱うために使用されるものです。文字を直接扱う事はできず、0と1の数値の組み合わせに変換します。組み合わせのルールが文字コードです。

パソコンの世界には以下のように文字コードというものがいくつかあります。

  • Shift-JIS
  • UTF-8
  • UTF-16
  • EUC
Shift-JIS 日本語に特化した文字コードの一つ。日本語以外は苦手。
UTF-8 世界中の言語に対応できる文字コード。ウェブサイトで主に使われる。
UTF-16 各文字を2バイトで表現する特徴がある。UTF-8と比べてファイルサイズが大きくなる
EUC 日本語文字コードの一つで、UNIX系で使用されている文字コード。

従来のメモ帳では Shift-JIS で保存されていました。しかし、ウェブサイトでは主に UTF-8 が使われているため、そのままアップロードすると文字化けが発生する事がしばしばありました。

現在はメモ帳は標準で UTF-8 で保存されるようになり、ウェブサイトでの文字化け問題は起こらなくなった事でしょう。

メモ帳で文字コードを指定して保存するには以下のように操作します。

動画で見る

文字コードを指定して保存する方法

メモ帳でテキストファイルを作り、ファイルメニューから名前を付けて保存を選択します。

画面右下の保存ボタンの横に、文字コードのメニューがあり選択できるようになっています。以下の中から選べます。

  • ANSI
  • UTF-16 LE
  • UTF-16 BE
  • UTF-8
  • UTF-8(BOM付き)

ANSI とは、日本語 Windows において Shift-JIS の事です。

文字コードを選んだら、保存ボタンを押します。

BOM付きとは?

BOM とは Byte Order Mark の略です。爆弾ではありません。

BOM が付くとファイルの先頭に小さなデータが付与されます。そのデータによってそのファイルが UTF-8 である事を明確に示す役割があります。

しかし、ウェブサイトにおいては BOM なしにしておいた方が問題は起きにくいでしょう。BOM が付く分ファイルサイズが大きくなるので、ウェブサイトでは BOM なしが推奨されます。

一部アプリケーションによっては BOM がないと UTF-8 であると認識できずに問題が起こることがありますので、どちらが正しいというわけではありません。

UTF-16 LE/BEとは?

LE はリトルエンディアン、BE はビッグエンディアンの略で、それぞれデータの並べ方の仕組みです。

例えば「あ」を UTF-16 のデータを表すと「0x3042」です。(0xとは次のデータが16進数である事を表す)

  • そのまま「3042」と並べるとビッグエンディアン
  • 逆に「2403」と並べるとリトルエンディアン

人間が見るにはそのまま並べられていた方がわかりやすいですが、パソコン側から見ると逆順の方が操作しやすいのです。

メモ帳が文字化けする

メモ帳でファイルを開くと、中身が文字化けする事があります。

これはファイルの文字コードと、メモ帳の認識文字コードが異なるため発生します。ファイルが壊れたわけではありません。

以下のようにして文字コードを指定して開いてみてください。

文字コードを指定して開く方法

開く時に文字コードを指定する事もできます。

メモ帳のファイルメニューを開き、「開く」を選択します。

画面下部の文字コードのドロップダウンメニューより、文字コードを指定します。

  • 自動検出
  • ANSI
  • UTF-16 LE
  • UTF-16 BE
  • UTF-8
  • UTF-8(BOM付き)

そしてファイルを選択して「開く」ボタンを押します。

スポンサーリンク


関連トピックス


-メモ帳
-