コンテンツに関する要件

オーディオの要件

Appleは、リスナーとサブスクリプション登録者の皆様にApple Podcastで最高の体験をお届けすることを目指しています。可能な限り小さいファイルサイズで、高品質かつ歪みのないリスニング体験を実現するため、以下のガイドラインを遵守してください。

Apple Podcast Connectのサブスクリプション登録者向けオーディオの要件

Apple Podcast Connectでは、以下の仕様に従ってフォーマットされたWAV、FLAC、MP3オーディオを使用できます。

WAVとFLAC

利用可能な場合は、必ずステレオのオーディオソースを使用してください。一部のビンテージ録音や野外録音のようにステレオソースが利用できない場合は、左右で同じ2つのチャンネルを持つオーディオソースを送信します。WAVファイルやFLACファイルでは、シングルチャンネルオーディオは使用できません。

FLACについて詳しくは、正規のコーデックを参照してください。

MP3

MP3では、モノラルソースとステレオソースの両方が使用できます。以下の表は、最もよく使用されているサンプルレートとチャンネル構成から、推奨ビットレート範囲をまとめたものです。

フォーマット	コンテナの種類	最小オーディオ	推奨オーディオ
パルス符号変調(PCM)	WAV (.wav)	サンプリングレート：44.1 kHz 解像度：16ビットまたは24ビット	サンプリングレート：44.1、48、88.2、96、176.4、または192 kHz 解像度：24ビット
FLAC(Free Lossless Audio Codec)	FLAC (.flac)	サンプリングレート：44.1 kHz 解像度：16ビットまたは24ビット	サンプリングレート：44.1、48、88.2、96、176.4、または192 kHz 解像度：24ビット
MP3(モノラル)	MP3 (.mp3)	サンプリングレート：44.1 kHz ビットレート：32 kbps	サンプリングレート：44.1／48 kHz ビットレート：96〜128 kbps
MP3(ステレオ)	MP3 (.mp3)	サンプリングレート：44.1 kHz ビットレート：64 kbps	サンプリングレート：44.1／48 kHz ビットレート：128〜256 kbps

RSSフィードオーディオの要件

RSSフィードの場合、Apple PodcastではMP3またはAACフォーマットを使用できます。

以下の表は、最もよく使用されているサンプルレートとチャンネル構成から、推奨ビットレート範囲をまとめたものです。これらのビットレートは、AACフォーマットとMP3フォーマットの両方に適用されます。同じビットレートの場合、AACの方が音質に優れています。

チャンネル数	22.05／24 kHz	44.1／48 kHz
1(モノラル)	40〜80 kbps	64〜128 kbps
2(ステレオ)	80〜160 kbps	128〜256 kbps

Apple Podcastにおけるオーディオのベストプラクティス

フォーマット

ポッドキャスト作成時に選択できるオーディオフォーマットには、いくつか種類があります。リスナーの帯域幅に負担をかけることなく簡単にストリーミングできるポッドキャストを配信するには、ファイルサイズを可能な限り小さくできるフォーマットでオーディオコンテンツをエンコードまたは圧縮する必要があります。RSSフィードの場合は、MP3の代わりにAACを使用することを強くお勧めします。なお、AACを選択する場合は、ADTSフォーマットよりも、最も効率的なストリーミングおよび正確なシークを行うことができるMP4フォーマットを使用することをお勧めします。

ビットレート

オーディオファイルを圧縮する際は、サンプルレート、チャンネル数、ビットレートに注意してください。これらの設定を慎重に選択しないと、オーディオの全体的な品質に影響が及ぶ可能性があります。たとえば、ビットレートを小さくすると、ストリーミングに適した小さなファイルサイズになるため送信の速度と効率は向上しますが、デコーディングや再生の段階で削除できない可聴域のアーティファクトや不要な音が音声ファイルに含まれる可能性があります。一方、ビットレートを大きくすると、ファイルサイズが大きくなるため音質は向上しますが、ファイルの送信に必要な帯域幅が広くなってしまいます。この場合、エンコードするコンテンツのチャンネル数やサンプルレートを考慮した上で、適切なビットレートを選択することが最善の折衷案となります。なお、ビットレートに制限が設けられている場合は、あらかじめ信号を調整しなければならない可能性があります。その場合は、サンプルレートを下げる(たとえば、48 kHzから24 kHz)か、チャンネル数をステレオからモノラルに減らすか、またはその両方を行なってください。

オーディオレベル

ポッドキャストを作成する際は、一貫性のある快適なリスニング体験を提供できるよう、オーディオレベルの設定の調整も行います。オーディオの設定により、ポッドキャストのラウドネスを管理して音を特定の範囲内に保つことで、すべての音声コンテンツが聞き取りやすく歪みのない状態にします。たとえば、大幅に圧縮および増幅されたコンテンツの場合、音量が大きすぎたり、ダイナミックレンジが不足したり、歪みが生じたりする可能性があります。一方、オーディオレベルが低いコンテンツでは、ダイナミックレンジはあるものの、静かすぎて音声コンテンツが聞き取れなかったり理解できなかったりします。どちらの場合も、リスナー自身で再生音量を快適なレベルに調整する必要があります。

このようにコンテンツごとに音量調整をしなければならない状況を回避するため、全体的なラウドネスを -16 dB LKFS(許容誤差は+/- 1 dB)に保ち、かつトゥルーピーク値が-1 dB FSを超えないようオーディオ信号をあらかじめ調整することをお勧めします。当該LKFS値とトゥルーピーク値は、ITU-R勧告BS.1770-5に従って算出されています。あらかじめ調整する場合は、エンコード処理の前に行なっていただく必要があります。これは、推奨トゥルーピーク値を順守していない場合、オーディオ圧縮アルゴリズムはラウドネスを修正せず、信号がクリップされるおそれがあるためです。

ラウドネスのメタデータ

ポッドキャストの基本情報であるラウドネス、ダイナミックレンジ、ピークレベルなどの特定のデータをオーディオファイルに直接埋め込むことができます。これを行うには、MP3ファイルのID3タグまたはMP4ファイルのヘッダーでデータを編集します。

当該データがファイル内に入力されると、再生エンジンが各種レベルを所定の再生レベルまたは目標レベルに自動的かつ正確に調整できるようになります。Appleは、iOSのミュージックAppにある設定「音量を自動調整」でこの仕組みを利用しています。

これが有効になっていると、ラウドネスまたは「音量を自動調整」のメタデータを含むコンテンツの再生レベルは常に-16 dBに保たれます。

チャプタ

チャプタがあることで、リスナーはエピソードの該当部分をすぐに見つけて移動できるようになります。Apple Podcastでのチャプタの使用についてはこちらをご覧ください。