Secara default, router jaringan menangani lalu lintas pada, pertama-dilayani pertama datang. Router jaringan pada volume tinggi link lalu lintas dapat memperkenalkan latency yang melebihi ambang batas yang diijinkan untuk VoIP. Penundaan tetap tidak dapat dikontrol, karena mereka disebabkan oleh jarak fisik perjalanan paket; Namun, latency dapat diminimalkan dengan menandai paket suara sebagai delay-sensitive dengan metode seperti DiffServ.
Endpoint VoIP biasanya harus menunggu selesainya pengiriman paket sebelumnya sebelum data baru dapat dikirimkan. Meskipun ada kemungkinan untuk mendahului (membatalkan) paket kurang penting pada pertengahan transmisi, ini tidak lazim dilakukan, terutama pada link berkecepatan tinggi di mana kali transmisi pendek bahkan untuk paket maksimum berukuran. Sebuah alternatif untuk preemption pada link lambat, seperti dialup dan digital subscriber line (DSL), adalah untuk mengurangi waktu transmisi maksimum dengan mengurangi unit transmisi maksimum. Tapi setiap paket harus berisi header protokol, jadi ini meningkatkan sundulan kepala relatif pada setiap link, bukan hanya kemacetan (biasanya akses Internet) link yang dilalui.
Modem DSL memberikan Ethernet (atau Ethernet melalui USB) koneksi dengan peralatan lokal, tapi di dalam mereka sebenarnya Asynchronous Transfer Mode (ATM) modem. Mereka menggunakan ATM Adaptation Layer 5 (AAL5) untuk segmen setiap paket Ethernet menjadi serangkaian sel ATM 53-byte untuk transmisi, pemasangan kembali mereka kembali ke frame Ethernet di ujung penerima. Sebuah identifier virtual circuit (VCI) merupakan bagian dari header 5-byte pada setiap sel ATM, sehingga pemancar dapat multipleks sirkuit virtual yang aktif (VC) dalam urutan acak. Sel dari VC yang sama selalu dikirim secara berurutan.
Namun, sebagian besar penyedia DSL hanya menggunakan satu VC untuk setiap pelanggan, bahkan mereka dengan layanan VoIP dibundel. Setiap frame Ethernet harus benar-benar dikirimkan sebelum yang lain dapat dimulai. Jika VC kedua didirikan, diprioritaskan dan disediakan untuk VoIP, maka prioritas paket data yang rendah dapat dihentikan pada pertengahan transmisi dan sebuah paket VoIP dikirim langsung pada prioritas tinggi VC. Maka link akan mengambil VC prioritas rendah di mana ia tinggalkan. Karena ATM link multiplexing pada sel-by-sel dasar, paket prioritas tinggi harus menunggu paling 53 kali byte untuk memulai transmisi. Tidak akan ada kebutuhan untuk mengurangi MTU interface dan menerima kenaikan sehingga dalam lapisan yang lebih tinggi overhead protokol, dan tidak perlu membatalkan paket prioritas rendah dan mengirim ulang nanti.
ATM memiliki substansial sundulan kepala: 5/53 = 9,4%, kira-kira dua kali sundulan Total overhead bingkai Ethernet 1500 byte. Ini "pajak ATM" yang dikeluarkan oleh setiap pengguna DSL apakah mereka mengambil keuntungan dari beberapa rangkaian virtual - dan beberapa kaleng.
Potensi ATM untuk pengurangan latency terbesar pada link lambat, karena terburuk latency menurun dengan meningkatnya kecepatan link. Sebuah ukuran penuh (1500 byte) frame Ethernet mengambil 94 ms untuk mengirimkan pada 128 kb / s tapi hanya 8 ms sebesar 1,5 Mbit / s. Jika ini adalah link bottleneck, latency ini mungkin cukup kecil untuk memastikan kinerja VoIP yang baik tanpa pengurangan MTU atau beberapa ATM VC. Generasi terbaru dari DSL, VDSL dan VDSL2, membawa Ethernet tanpa perantara ATM lapisan / AAL5, dan mereka umumnya mendukung IEEE penandaan prioritas 802.1p sehingga VoIP dapat antri di depan kurang lalu lintas waktu-kritis.
Voice, dan semua data lainnya, perjalanan dalam paket melalui jaringan IP dengan kapasitas maksimum tetap. Sistem ini mungkin lebih rentan terhadap kemacetan Dan serangan DoS daripada sistem sirkuit tradisional beralih; sirkuit sistem kapasitas cukup akan menolak koneksi baru sambil membawa sisanya tanpa gangguan, sedangkan kualitas data real-time seperti percakapan telepon pada jaringan packet-switched menurunkan secara dramatis beralih.
Penundaan tetap tidak dapat dikontrol karena mereka disebabkan oleh jarak fisik perjalanan paket. Mereka sangat bermasalah ketika sirkuit satelit terlibat karena jarak jauh ke satelit dan kembali geostasioner; keterlambatan 400-600 ms khas.
Ketika beban pada link tumbuh sangat cepat sehingga mereka switch pengalaman antrian meluap, hasil kemacetan dan paket data yang hilang. Ini menandakan protokol transport seperti TCP untuk mengurangi laju transmisi untuk mengurangi kemacetan. Tapi VoIP biasanya menggunakan UDP tidak TCP karena pulih dari kemacetan melalui pengiriman ulang biasanya memerlukan terlalu banyak latency. Jadi mekanisme QoS dapat menghindari hilangnya diinginkan paket VoIP dengan segera mengirimkan mereka di depan setiap antri lalu lintas massal pada link yang sama, bahkan ketika itu antrian lalu lintas massal meluap.
Penerima harus resequence paket IP yang tiba rusak dan memulihkan anggun ketika paket tiba terlambat atau tidak sama sekali. Hasil Jitter dari cepat dan acak (yaitu terduga) perubahan dalam panjang antrian sepanjang jalan internet diberikan karena persaingan dari pengguna lain untuk link transmisi yang sama. Penerima VoIP melawan jitter dengan menyimpan paket yang datang sebentar dalam "de-jitter" atau "playout" penyangga, sengaja meningkatkan latency untuk meningkatkan peluang bahwa setiap paket akan berada di tangan ketika saatnya untuk mesin suara untuk memainkannya. Penundaan menambahkan dengan demikian kompromi antara latensi yang berlebihan dan putus sekolah yang berlebihan, yaitu gangguan audio yang sesaat.
Meskipun jitter adalah variabel acak, itu adalah jumlah dari beberapa variabel acak lain yang setidaknya agak independen: penundaan antrian individu router sepanjang jalur internet yang bersangkutan. Jadi menurut teorema limit sentral, kita dapat model jitter sebagai variabel acak gaussian. Hal ini menunjukkan terus memperkirakan penundaan mean dan deviasi standar dan pengaturan delay playout sehingga hanya paket tertunda lebih dari beberapa deviasi standar di atas rata-rata akan tiba terlambat untuk menjadi berguna. Dalam prakteknya, bagaimanapun, varians dalam latency dari banyak jalan internet didominasi oleh sejumlah kecil (sering salah) relatif lambat dan padat "bottleneck" link. Kebanyakan link backbone internet sekarang begitu cepat (misalnya 10 Gbit / s) bahwa penundaan mereka didominasi oleh media transmisi (serat optik misalnya) dan router mengemudi mereka tidak memiliki cukup penyangga untuk antrian penundaan untuk menjadi signifikan.
Ia telah mengemukakan mengandalkan sifat packetized media dalam komunikasi VoIP dan mengirimkan aliran paket dari ponsel sumber ke telepon tujuan secara bersamaan di rute yang berbeda (multi-path routing) .Dalam sedemikian rupa, kegagalan sementara memiliki dampak yang lebih rendah pada kualitas komunikasi. Dalam kapiler routing telah disarankan untuk menggunakan kode Fountain tingkat paket atau khususnya kode raptor untuk transmisi paket ekstra berlebihan membuat komunikasi lebih handal.
Sejumlah protokol telah didefinisikan untuk mendukung pelaporan kualitas layanan (QoS) dan kualitas pengalaman (QoE) untuk panggilan VoIP. Ini termasuk RTCP diperpanjang Laporan (RFC 3611), Ringkasan Laporan SIP RTCP, H.460.9 Lampiran B (untuk H.323), H.248.30 dan MGCP ekstensi. RFC 3611 VoIP Metrik blok yang dihasilkan oleh telepon IP atau gateway selama panggilan hidup dan berisi informasi tentang tingkat packet loss, tingkat terbuang paket (karena jitter), packet loss / membuang metrik meledak (pecah panjang / kepadatan, panjang gap / density), delay jaringan, end delay sistem, sinyal / noise / tingkat gema, mean Opinion Score (MOS) dan faktor R dan konfigurasi informasi yang berkaitan dengan buffer jitter.
RFC 3611 metrik VoIP laporan dipertukarkan antara endpoint IP secara berkala selama panggilan, dan akhir pesan panggilan dikirim melalui SIP RTCP Ringkasan Laporan atau salah satu ekstensi protokol signaling lainnya. RFC 3611 metrik VoIP laporan dimaksudkan untuk mendukung umpan balik real time yang berkaitan dengan masalah QoS, pertukaran informasi antara titik akhir untuk meningkatkan kualitas panggilan perhitungan dan berbagai aplikasi lainnya.
Daerah pedesaan khususnya yang sangat menghambat kemampuan mereka untuk memilih sistem VoIP melalui PBX. Ini umumnya ke akses broadband supercepat miskin di daerah pedesaan negara. Dengan rilis data 4G, ada potensi untuk pengguna korporat berbasis di luar daerah-daerah berpenduduk untuk beralih koneksi internet mereka data 4G, yang relatif secepat koneksi broadband supercepat biasa. Ini sangat meningkatkan kualitas pengalaman pengguna dan keseluruhan sistem VoIP di daerah-daerah. Metode ini sudah diuji coba di pedesaan Jerman, melebihi semua harapan.