logo itpoint.cz

Technické principy IP telefonie

Třetí z připraveného seriálu celkem jedenácti přednášek zaměřených na problematiku teorie a praxe IP telefonie, které zazněly na dvoudenním odborném semináři ve dnech 26. a 27.5. 2004 v pražském hotelu Olšanka. Za účasti předních odborníků kci pořádala ČVUT FEL / Katedra telekomunikační techniky, Sdělovací technika a ProTel engineering s.r.o.. Cílem přednášek je uživatelům se zkušenostmi s klasickou telefonií zprostředkovat informace o technickém řešení i organizačních souvislostech telekomunikací s moderními počítačovými sítěmi a uživatelům s praxí v oblasti výpočetní techniky a počítačových sítí poskytnout přehled o technických i organizačních problémech specifických pro telefonní techniku.

Třetí z připraveného seriálu celkem jedenácti přednášek zaměřených na problematiku teorie a praxe IP telefonie, které zazněly na dvoudenním odborném semináři ve dnech 26. a 27.5. 2004 v pražském hotelu Olšanka. Za účasti předních odborníků akci pořádala ČVUT FEL / Katedra telekomunikační techniky, Sdělovací technika a společnost ProTel engineering s.r.o. (TZ k této akci naleznete ZDE). Server telefonie.cz měl tu čest být mediálním partnerem této akce. Všech 11 přednášek bude průběžně zveřejněno - vždy 2 x týdně a to v ÚT a PÁ (poslední v ÚT 21.12. 2004) a všechny budou také následně na serveru dlouhodobě přímo dostupné v sekci zpráv "IP telefonie". Cílem přednášek je uživatelům se zkušenostmi s klasickou telefonií zprostředkovat informace o technickém řešení i organizačních souvislostech telekomunikací s moderními počítačovými sítěmi a uživatelům s praxí v oblasti výpočetní techniky a počítačových sítí poskytnout přehled o technických i organizačních problémech specifických pro telefonní techniku.

Celkový přehled všech jedenácti přednášek :

  • Konvergence telekomunikačních a informačních technologií
  • Problematika QoS v klasických a IP sítích
  • Technické principy IP telefonie
  • Principy zpracování hlasu v klasické a IP telefonii
  • Metody signalizace v telekomunikačních sítích
  • Signalizační a komunikační protokoly v IP telefonii
  • Číslování a adresování v klasických a IP telefonních sítích
  • Přenosové plány (útlum a zpoždění) v klasické a IP telefonii
  • Měření a hodnocení QoS v IP telefonii
  • Ekonomické aspekty IP telefonie
  • Normalizační aktivity v oboru IP telefonie


- bude zveřejněno k 26.11. 2004 / PÁ
- bude zveřejněno k 30.11. 2004 / ÚT
- bude zveřejněno k 3.12. 2004 / PÁ
- bude zveřejněno k 7.12. 2004 / ÚT
- bude zveřejněno k 10.12. 2004 / PÁ
- bude zveřejněno k 14.12. 2004 / ÚT
- bude zveřejněno k 17.12. 2004 / PÁ
- bude zveřejněno k 21.12. 2004 / ÚT

Abstrakt : V části věnované "Technickým principům IP telefonie" bude nejprve vysvětlen pojem IP telefonie společně s pojmem VoIP a důvody pro jejich nasazení do komunikačních sítí. V další části budou zmíněny zásadní rozdíly mezi klasickou a IP telefonií z hlediska jejich vývoje a odlišností technických principů. Během téměř deseti let se IP telefonie propracovala přes několik standardů a v současnosti jsou dvě hlavní větve, protokol ITU-T H.323 a IETF SIP. Ve srovnání s klasickou telefonií nebylo v oblasti VoIP dosud dosaženo takové unifikace, jako např. u ISDN, ale oba zmíněné standardy vycházejí ze shodných principů a odlišnosti jsou až ve vyšších vrstvách protokolového modelu. Ačkoliv je VoIP jedna z mnoha technologií, přesto se postupně stává stěžejní platformou pro hlasovou komunikaci v sítích NGN (Next Generation Network). V další části jsou zmíněny scénáře použití IP telefonie, které rovněž mají svůj vývoj odvíjející se od návratnosti vložených investic, od nejjednodušších scénářů IP Phone to IP Phone až po řešení IP Centrex, rovněž jsou zde zmíněny moduly pro vytváření hlasových brán. V poslední části je vysvětlen postup zpracování signálu v IP telefonii z hlediska systémových komponent podílejících se na procesu zpracování.

1 Vymezení pojmu IP telefonie

IP telefonii chápeme jako službu založenou na technologii VoIP (Voice over IP), která umožňuje přenos hlasu v sítích s přepojováním paketů a založených na protokolu IP. VoIP tak tvoří další alternativu ke klasické telefonii, založené na použití sítí s přepojováním okruhů přes veřejnou telefonní sít. Tato alternativa je velice perspektivní a to hned z několika důvodů. Datové sítě se v současnosti rozvíjejí a šíří mnohem rychleji než telefonní sítě. Přenos hovorů v datových sítích je ekonomicky výhodný, protože rozsáhlé a geograficky rozdělené společnosti mohou uskutečňovat hlasový provoz po vlastních datových sítích, jimiž většina společností disponuje. Připojení operátora poskytujícího na IP konektivitě i hlasové služby logicky vede k nižším cenám, neboť jsou redukovány náklady na komunikační infrastrukturu. Dalším aspektem IP telefonie jsou nové aplikace a doplňkové služby využívající informační technologie, právě v propojení s oblastí IT je ukrytý dosud nevyužívaný potenciál IP telefonie. Další důvod zavádění VoIP je snaha o sjednocení komunikačních standardů a vytvoření tak sítí s integrovanými službami, které jsou schopny nad jedinou infrastrukturou přenášet data, hlas nebo video, viz [1], [2].

2 Zásadní rozdíly mezi klasickou a IP telefonií

Veřejná telefonní síť se 100 let vyvíjela v analogovém světě, koncové telefonní přístroje i ústředny byly analogové a také všechny přenosy byly prováděny analogovou formou. Standardizace PCM (pulzní kódové modulace, ITU-T G.711) v roce 1972 změnila oblast telekomunikací a nastartovala její digitalizaci. Po více než třiceti letech je v sítích s přepojováním okruhů stále dominantní modulace PCM s přírůstky přenosových kanálů po 64 kbit/s a spojovací pole propojovacích prvků je většinou založeno opět na propojování toků 64 kbit/s. Nové techniky zpracování hlasu, především kodeky s lineární predikcí, umožnily redukovat hovorové pásmo při zachování kvality a jejich nasazení se uplatnilo v polovině devadesátých let právě v IP telefonii. Dominantní se stalo kódování dle ITU-T G.729 a G.723.1., přičemž povinné pro všechny zařízení je schopnost dorozumět se na G.711. V roce 1995 firma Vocaltec Inc. představila první řešení pro IP telefonii (prenatální verze H.323). To však přineslo řadu problémů, protože IP sítě se svou podstatou velmi výrazně odlišují od přepínaných telefonních sítí :

Má-li komunikační síť poskytovat nové druhy služeb, musí umožňovat poskytování těchto služeb v požadované kvalitě. Zde se zavádí pojem kvalita služeb (Quality of Service, QoS). Koncept QoS je ve skutečnosti značně široký a může zahrnovat velmi mnoho různých oblastí, parametrů a veličin, kterých se může týkat. V současnosti lze provozovat v sítích s protokolem IP hlasovou komunikaci v požadované kvalitě díky třem faktorům :

2.1 Přenos hlasu v sítích IP

V sítích s protokolem IP se hlas přenáší v paketech RTP (Real Time Protocol), které na transportní vrstvě používají protokolu UDP (User Datagram Protokol) a na síťové pochopitelně IP. Formát tohoto paketu je dán doporučením IETF z roku 1996 s označením RFC 1889/1890 pro RTP/RTCP, přičemž RTP řeší vlastní přenos hlasové informace a RTCP kontrolní mechanizmus v doručování RTP (Real Time Control Protocol)

IP20 oktetů

UDP8 oktetů

RTP12 oktetů

Užitečná informace20 až 160 oktetů

IP/UDP/RTP hlavička (40 oktetů)
Obr. 1: Formát paketu RTP

Na obr. 1 je znázorněn formát paketu RTP a je možné si všimnout, že užitečná informace má omezenou velikost v rozsahu 20 až 160 oktetů. Důvodem je fakt, že pakety s menší velikostí způsobují mnohem menší zpoždění na směrovačích při odesílání do WAN sítí (serialization delay). Pokud bychom například čistě teoreticky využili velikost MTU (Maximal Transfer Unit) 1500 oktetů a snažili se takovýto paket přenést přes linku WAN s kapacitou 64 kbit/s, tak nám odesílání tohoto paketu zabere 187,5 ms, což je zpoždění s označením "katastrofické", neboť dle doporučení ITU-T G.114 máme pro vysokou kvalitu hovoru určeno max. 150 ms na dobu doručení informace od odesílatele k příjemci. Navíc je tento typ zpoždění pouze jednou z komponent celého řetězce modelu zpoždění hlasového provozu v IP sítích, kde největší trauma způsobuje proměnné zpoždění (jitter) a významnou měrou může přispět už volba kodeku (například G.723.1 přispívá do celkového zpoždění hodnotou minimálně 37,5 ms).

Při použití minimální velikosti užitečné zátěže v RTP paketu dostáváme zase vysoké režie na přenos hlavičky, a to v poměru 2:1, tzn. pokud budeme chtít přenést hlas kódovaný dle ITU-T G.729 s nominální přenosovou rychlostí 8 kbit/s, tak potřebujeme celkově 24 kbit/s v IP síti. Tento problém se dá řešit pomocí komprese hlavičky RTP, v tom případě hovoříme o protokolu cRTP (compressed RTP) a lze dosáhnout komprese ze 40 oktetů na 2-3 oktety. Faktem ovšem je, že použití cRTP zvyšuje nároky na procesorový výkon směrovače, procesor musí zpracovávat další algoritmus a jeho zatížení roste s počtem hovorů, proto je nutné ověřit před nasazením cRTP jeho vliv na stabilitu funkčnosti směrovače v zátěžovém testu.

Během přenosu RTP dostáváme informace o počtu ztracených paketů a proměnném zpoždění pomocí kontrolního protokolu RTCP, jeho zajímavým rozšířením je RTCP XR (Control Protocol Extended Reports), který umožňuje zasílání informace o kvalitě hovoru ve známém parametru MOS (Mean Opinion Score), jedná se o RFC 3611 z konce roku 2003, viz [3], [4], [5].

2.2 Přenos signalizačních informací v sítích IP

Obdobně jako v sítích s přepínáním okruhů, je každý hovor provázen signalizačními informacemi při sestavení spojení, jeho udržení a nakonec rozpadu. V sítích s protokolem IP se signalizační informace mohou přenášet v transportních protokolech UDP nebo TCP, tak vzniká otázka, kterému transportnímu protokolu dát přednost. V sítích IP se používají pro hlas dva dominantní protokolové modely, a to dle ITU-T H.323 nebo IETF SIP-SDP.

V případě protokolu SIP je to opravdu jedno, protože je schopen signalizační informace variabilně přenášet na obou protokolech dle konfigurace daného zařízení, ale standardně používaný je protokol UDP, konkrétně port UDP 5060.

V případě H.323 jsou signalizační informace k hovoru dány doporučením H.225.0, které využívá obou protokolů UDP i TCP, standardně řídící prvek sítě (Gatekeeper) naslouchá signalizaci H.225.0/RAS na portu UDP 1719 a případně i na 1718 (pro multicast 224.0.1.41), hovorová signalizace spojení H.225.0/Q.931 se přenáší na portu TCP 1720. Navíc je tu další část signalizace dle ITU-T H.245 pro vyjednávání parametrů audia/videa, která je postavena na TCP, od verze H.323v2 je pomocí metody Fast Connect schopná většinu informací přenést v H.225.0/Q.931. Protokolový model H.323 je robustní a precizně navržen, pro výrobce zařízení VoIP znamená ovšem jeho složitost komplikaci a v praktických implementacích se využívá zhruba 10 % jeho možností a mnohem blíž je tvůrcům aplikací protokol SIP, který byl do roku 2001 ovšem silně ovlivněn lidovou tvořivostí (ASCII kód SIPu je čitelnější než binární H.323 kódovaný dle ASN.1), viz [6], [7], [8].

3 Scénáře použití IP telefonie

Voice over IP prochází evolucí stejně jako jakákoliv rozvíjející se technologie. IP telefonie se v počátcích orientovala striktně na oblast Internetu, kdy se používaly samostatné IP telefony především ve formě aplikací pro PC a nebylo realizováno propojení s PSTN, jednalo se o pionýrské začátky IP telefonie, obr. 2.

 Scénář IP-Phone to IP-Phone
Obr. 2: Scénář IP-Phone to IP-Phone

Použití v první fázi lze označit jako scénář IP-Phone to IP-Phone, vlastní IP telefon byl realizován jako SW aplikace pro PC, cílem bylo především odzkoušet možnost telefonie přes IP síť.

Ve druhé fázi dochází k propojení se sítí PSTN (Public Switched Telephone Network) a jsou realizovány dva modely, první model je používán v korporátním segmentu a propojuje pobočkové ústředny (PBX) geograficky vzdálených lokalit v modelu PBX to PBX dle obr. 3, druhý model se objevuje ve veřejné síti a realizuje výstup z IP sítě v určitém bodě a nabízí přístup do PSTN jako službu VoIP to PSTN, obr. 4.

 Scénář PBX to PBX
Obr. 3: Scénář PBX to PBX

Zatímco první model je používán pro vnitrofiremní komunikaci, druhý model je nasazován operátory především pro zahraniční destinace a volání má nižší hovorné, postupně tento model implementují všichni telekomunikační operátoři a nabízejí jako službu cenově zvýhodněných volání.

 Scénář VoIP to PSTN
Obr. 4: Scénář VoIP to PSTN

Ve třetí fázi je nabízena IP telefonie jako plnohodnotná náhrada telefonních přípojek a klasických pobočkových ústředen, telekomunikační operátoři nabízejí řešení IP Centrex a přes širokopásmový přístup jsou schopni nabízet pronájem linek, komfortní služby včetně např. ovládání těchto služeb přes web a pro firemní komunikaci plnohodnotnou náhradu PBX s funkcionalitou vnitrofiremní komunikace kdekoliv, podmínkou je IP konektivita.

Packet + Centrex = IP Centrex

Tento scénář je znázorněn na obr. 5, jako páteřní je použitá ATM nebo IP síť, přístupová síť musí mít dostatečnou kapacitu, aby byla garantována kvalita poskytovaných služeb, na společné širokopásmové konektivitě jsou poskytovány všechny služby, jak hlasové, tak i přístup do sítě Internet.

 Scénář IP Centrex
Obr. 5: Scénář IP Centrex

Připojení analogových přípojek a faxů musí být řešeno přes bránu s analogovým rozhraním, neboť filozofie IP Centrexu je postavena na poskytování služeb prioritně přes IP, signalizační brána podporuje signalizační systém č.7 (SS7), hlasová komunikace v rámci IP Centrex je založena na standardech H.323 a SIP.

4 Propojení PBX s hlasovou bránou

Hlasová brána VoGW (Voice Gateway) je klíčovou částí služeb IP telefonie, neboť umožňuje spojení mezi telefonní a paketovou sítí, to znamená, že provádí všechen nezbytně nutný fyzický překlad a hlasovou kompresi a tím dovoluje volání mezi těmito dvěma prostředími. Hlasová brána poskytuje tyto následující funkce :

 Příklady modulů do směrovačů pro realizaci hlasové brány
Obr. 6: Příklady modulů do směrovačů pro realizaci hlasové brány

Hlasová brána může být realizována na PC formou karet s příslušným rozhraním a SW aplikací nebo častěji formou směrovače doplněného o hlasové moduly, na obr. 6 jsou zobrazeny moduly VIC (Voice Interface Card) s rozhraním BRI a E&M.

4.1 Modul FXS a FXO

Modul poskytuje připojení na účastnickém rozhraní U se smyčkovou signalizací, umožňuje DTMF volbu dle doporučení ITU-T Q.23. Modul FXS pracuje v režimu analogové účastnické sady, na rozhraní lze připojit přímo telefonní přístroj. V případě připojení PBX se linka přivádí na port karty státního přenašeče standardně používaného pro připojení státní linky. Provozovat modul lze i obousměrně, ale v příchozím směru není možné provolení do ústředny až na pobočku, což je dáno typem použité signalizace. Pokud konkrétní PBX umožňuje tónovou dovolbu na portech státních linek, lze dosáhnout provolení na konkrétní pobočku ústředny. V případě potřeby je možné modifikovat řadu parametrů, např. impedanční přizpůsobení, generování šumu, zisk na vstupu, útlum na výstupu, potlačení ozvěny, doby čekání na volbu čísla, časy mezi volbou čísel apod.. V případě připojení PBX je odchozí provoz z PBX bez omezení, v případě příchozího volání je možné předat hovor na konkrétní pobočkovou linku např. přes spojovatelské pracoviště.

Modul FXO pracuje v režimu analogového přístroje. Na rozhraní lze připojit např. státní tel. linku nebo analogovou linku pobočkové ústředny.

4.2 Modul EM

V případě VoIP brány s modulem E&M se jedná o analogové rozhraní pro připojení PBX s oddělenou hovorovou a signalizační částí. Pro hovor se používá dvoudrátová nebo i čtyřdrátová cesta s možností odděleného nastavení přijímacích/vysílacích útlumů/zesílení na delších trasách. Rozhraní pracuje s EM linkovou signalizací a může být doplněno o DTMF nebo MFC-R2 registrovou signalizací. Pro vlastní EM linkovou signalizaci je nejvhodnější zvolit signalizaci US-WINK, neboť s touto signalizací jsou výborné zkušenosti. Při zahájení komunikace se posílá značka WINK, po které následuje DTMF volba, značka přihlášení je přijata po přihlášení volaného a následně se propojují hovorové cesty, nedochází k tarifování před přihlášením, což je důležité u tranzitních volání.

Výhoda E&M modulu oproti FXS nebo FXO spočívá v možnosti technicky neomezené obousměrné komunikace, tzn. provolení na pobočku ústředny v příchozím volání a na rozdíl od FXS je přenášena IP sítí značka přihlášení, tzn. u tranzitního hovoru nemůže dojít k zahájení tarifování během vyzvánění.

4.3 Modul ISDN BRI nebo PRI

Modul BRI/ISDN je určen pro připojení koncového zařízení ISDN (tel. přístroj - varianta TE) nebo PBX na rozhraní S0/T0 se dvěma nezávislými kanály, základní přípojka ISDN. V případě PRI/ISDN bude připojena PBX na rozhraní S2M s 30-ti nezávislými kanály, primární přípojka ISDN. Na straně hlasové brány se nastavuje v případě připojení PBX strana síťová (Network Side), pokud jde o připojení do veřejné sítě, tak strana uživatele (User Side). Používá se osvědčený signalizační sytém DSS1 (Digital Signalling System No.1.), případně lze použít i Q-signalizaci, pokud jde o propojení PBX v rámci podnikové sítě, jestliže je síť nehomogenní a obsahuje PBX různých výrobců, tak je mnohdy použití Q-signalizace zajímavým experimentem, viz [9].

QSIG protokol je identický ve struktuře s DSS1, vrstva 3 je u QSIG a DSS1 rozdílná. Jelikož je QSIG definován na "logickém" referenčním bodě, může být protokolová sada definovaná na různých fyzických rozhraních. Rozšířený ITU-T ISDN referenční model zahrnuje signalizaci mezi dvěmi PINX (Privátní ISDN ústředna) použitou v privátní ISDN. Tady je nutno určit dva nové body, bod "Q" a bod "C". Referenční bod "Q" je logický signalizační bod mezi dvěmi PINX. Fyzické spojení mezi PINX je zřízeno v "C" referenčním bodě. Pomocí Q-signalizace je přenášena celá řada zajímavých služeb, jako je např. :

5 Postup zpracování hlasu v IP telefonii

Zpracování signálů musíme rozdělit na hlas a signalizaci, hlas se přenáší protokolem RTP (založeno na UDP) a signalizace pomocí TCP nebo UDP. Na obr. 7 je postup operací při zpracování audio signálu na straně odesílatele, informace je kódována hlasovým kodérem a následně rozdělena do bloků paketizátorem.

 Zpracování hlasu na straně odesílatele
Obr. 7: Zpracování hlasu na straně odesílatele

Signalizace je zpracovávána odděleně a je prakticky ryze SW záležitostí, protože úkolem je vzájemně mapovat zprávy používaných protokolů (např. DSS1 a H.323 v případě hlasové brány), signalizační informace jsou vyhodnoceny a dle nastavených pravidel se jejich část zapracuje do paketů pro příjemce nebo jsou ještě odeslány další dotazy na prvky VoIP systému (na SIP Server nebo H.323 Gatekeeper).

Zpracování hlasu vyžaduje různou náročnost na procesorový výkon MIPS (Million Instructions Per Second), to je dáno kodekem. Pro efektivní využití IP sítí se používají většinou adaptivní metody komprese hlasu tak, aby bylo pásmo optimálně využito. Současné procesory jsou více než dostačující pro kompresi i dekompresi současně, v případě požadavků na kompresi více souběžných spojení se využívají signálové procesory DSP, které zároveň mohou provádět odečet ozvěny (echo-cancellation). Hlas je na straně odesílatele po kódování příslušným kodekem paketizován do balíků s užitečnou zátěží 20 až 160 oktetů a se standardní hlavičkou 40 oktetů. Pakety jsou odesílány s časovými rozestupy, tento čas lze označit jako interval Dts . Ze znalosti Dts a použitého kodeku můžeme definovat velikost užitečné zátěže v RTP paketu označené jako ps. Pro výpočet použijeme vztah (1).

(1)

[oktet]
DtS [ms] sample time, rozestup mezi pakety se vzorky
pS [oktet] payload size, užitečná zátěž
cr [kbit/s] codec rate, vlastnost kodeku – přenosová rychlost

Při určení velikosti užitečné zátěže se musí platit podmínka pro RTP paket

pS ³ 20 oktetů Ù pS £ 160 oktetů.

Ze znalosti velikosti užitečné zátěže a formátu paketu, můžeme zobecnit přenosovou režii při konkrétním typu kódování podle vztahu (2), ve kterém je započtena celková velikost paketu, viz [5].

(2)

[kbit/s]
BT             [kbit/s] Bandwith tax, režie přenosu
h              [oktet] header, hlavička

Při průchodu IP sítí dochází k časovému posunu mezi RTP pakety především vlivem jejich řazení ve frontách na směrovačích, na obr. 8 je znázorněna situace, kdy některé pakety přicházejí s menšími či většími časovými rozestupy. Na tento problém bylo pamatováno již při tvorbě standardu RFC 1889 pro RTP protokol a v hlavičce paketu je přenášena informace „Timestamp“ vyjadřující vzorkovací značku prvního oktetu v RTP paketu odvozenou od lineárního časovače. Díky této značce je možné jitter přesně rozpoznat a jeho vliv eliminovat.

 Pusobení promenného zpoždení na odstup mezi RTP pakety
Obr. 8: Působení proměnného zpoždění na odstup mezi RTP pakety

Na straně příjemce je paket zařazen do vyrovnávací mezipaměti, která má za úkol minimalizovat účinek proměnného zpoždění v IP síti (jitter), obr. 9.

 Zpracování užitecné záteže RTP paketu na strane príjemce
Obr. 9: Zpracování užitečné zátěže RTP paketů na straně příjemce

Následně jsou data z mezipaměti předávány k dekódování, mezipaměť je vhodné nastavit na násobky dob trvání kódovaných hlasových fragmentů při paketizaci (např. 60 ms je nejvhodnější, neboť vyhovuje pro kódování G.711, G.729 i G.723.1.), některá zařízení umožňují samokorekci velikosti mezipaměti a pomocí sofistikovaných algoritmů přizpůsobují její hodnotu aktuální situaci.

Ing. Miroslav Vozňák, Ph.D.
VŠB-TUO, FEI / Katedra elektroniky a telekomunikační techniky
miroslav.voznak@vsb.cz

ZDE naleznete přehled firem na itpoint.cz, které se zabývají nabídkou služeb IP telefonie

telefonie.cz

Článek ze dne 23. listopadu 2004 - úterý

Všechna firemní zařízení Android pod kontrolou