Porovnání cen Odorik s jinými - zajímavá cenová kalkulačka

Odeslat odpověď


Odpověď na tuto otázku je nutná pro rozlišení automatizovaných pokusů o registraci.

BBCode je vypnutý
Smajlíci jsou vypnutí

Přehled tématu
   

Rozšířit náhled Přehled tématu: Porovnání cen Odorik s jinými - zajímavá cenová kalkulačka

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od noneis » úte 29. črc 2014 17:24:49

Olaf píše: Takže ještě jednou ve zkratce: v grafech (na ifon.cz) je na vodorovné ose _reálný_ provolaný čas. Tedy takový čas, který účastník opravdu provolá. Jenže jak víme, není to čas, který účtuje operátor. Účtovaný čas závisí na tarifikační míře a její vliv na čas/cenu není konstantní, odvíjí se od dalších věcí. Tenhle vliv kalkulačka na ifon.cz počítá (na rozdíl od jiných kalkulaček) pro zadané vstupy, resp. počítá s typickými hodnotami, pokud uživatel nechce situaci komplikovat a netuší, co má dělat. Toto navýšení je promítnuto do ceny, která je na svislé ose. Jednodušeji to už říct nedokáži.
To jsem nikde nerozporoval. A pokud vím, tak ani nikdo jiný. Nevím proč to tedy neustále dokola opakujete.
Olaf píše: S "průměrnými" cenami za rok či dva nepočítá. Jsou k tomu jisté důvody (například i ten, že analýza faktur měla být původně vlastní prémiovou službou pro klienta, který to chce a je ochoten zaplatit za službu -- to by mne třeba zajímalo, jestli by toho pan Noneis využil).
Klient nemusí chtít dlouho čekat na analýzu, očekává rychlou (a automatizovanou) analýzu. Jestli za ní je ochoten zaplatit, to je jiná věc. Já bych to nevyužil z výše zmíněného důvodu.
Olaf píše: Pro pana Noneise :) Ten škálový faktor mám dobře, vždyť je odvozen přímo z normovací podmínky, máte to tam uvedeno celé. Vy na mě tady vždy vytáhnete nějaký konkrétní výsledek či vztah, aniž byste řekl, co vlastně je zač a jak jste ho odvodil. Reverzní inženýrství bývá sice někdy zábavné, ale jen v tom případě, že z toho člověk má nějaký užitek -- což zde není splněno, je to jen přetahovaná o nic. Mě poněkud unavuje se v tom opakovaně piplat a zkoumat, co jste vlastně chtěl říct. Sedět u piva, problém vyřešíme za pár minut a už se o tom více nebude bavit, v tom jsou diskusní fóra jiná. Proto ale vždy volte obecnou cestu -- to, co jste u mě nazval zbytečným povídáním (důkazy).
Napsal sem, že "Mimochodem tam máte ten korekční člen špatně a integrál z vaší hustoty pravděpodobnosti tedy není jednička. Konkrétně když přecházíte k integrálu t*NR(t,mu,sigma) ...". Neboli výrok se vztahoval k hustotě pravděpodobnosti využité při výpočtu střední ceny, nikoliv k té ve větě.

Ty věty s důkazy jsem označil za "ač krásné tak naprosto zbytečné", protože oponovali ilustračnímu grafu. Nerozporuji jejich platnost. Vy jste pak tu větu špatně použil na zjištění střední ceny. Ale tu střední cenu(C) jste tím použitím nezískal, získal jste hodnotu h>=C. Ten škálovací faktor totiž platí jen pro situaci v té větě. Tu větu tedy nemůžete použít k vypočtení samotné střední ceny, pro daný účel se tedy stává zbytečná :D (Partial expectation(jen definice pomocí Conditional expectation) + vaše definice korigovaného NR -> musí se totiž použít podmíněná hustota pravděpodobnosti)

S větami a důkazy jste do diskuze o telekomunikacích přišel vy a proto se nemůžete divit tomu, že vám tam lidi budou hledat chyby.
Olaf píše: Ono se pak lépe replikuje tvrzení. Od oka hádám, že jste nechtěl říct, že integrál z hustoty pravděpodobnosti není jednička (protože očividně je), ale že striktně vzato střední hodnota "spotřeby" není pak stejná jako vstupní hodnota u původního NR. Je to pravda? Pokud ano, tak jsem nikde netvrdil, že z matematického hlediska mu a sigma starého (kompletního) NR(t, mu, sigma^2) je střední hodnotou a disperzí nového (useknutého) NR. Tam se to trošku posouvá, což je jasné. Vzhledem k tomu, jakým způsobem nejdříve získáváte mu a sigma a co za předpoklady používáte, je to zcela jedno.
Nemluvil sem o hustotě pravděpodobnosti z věty, ale to už je skutečně jedno, neboť se jednalo o ilustrační graf. Když jste netvrdil, že se střední hodnota zachovává, tak z jakého důvodu jste tu větu použil na vypočtení střední ceny? Aby jste dostal špatný výsledek?

Ještě ke grafům. Dle vašich údajů je mean(sigma) = 0.43*mu na vzorku 2000 SIM karet, vaše grafy uvažují pouze menší sigmy, graf pana Soukupa naopak o dost větší sigmy. Sigma = 0.4*mu reprezentuje zhruba ten průměr. Dále má na grafy ohromný vliv cena jednotky po vyčerpání balíčku viz např. ČD tarif 2 za 88Kč, který má sice 70 volných minut ale po vyčerpání se platí 5,04 Kč za minutu. V takovém případě je vliv balíčků mnohem větší než vliv tarifikace.

Jinak vaše kalkulačka je v současnosti nelepší v ČR. Tedy kromě dat a PR(Public relations) :D

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od xsouku04 » úte 29. črc 2014 16:33:59

OK, díky za vysvětlení.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od Olaf » úte 29. črc 2014 16:27:41

xsouku04 píše: Myslím, že téměř nikdo nemá spotřebu úzce rozloženu kolem nějakého počtu minut. Natož takto kulatého počtu minut.
Vždyť to tady celou dobu říkám! :) Ale teď vážně, vy to myslíte asi jinak než já. Třeba Noneis říká, že drží nějaké průměrné spotřeby s variabilitou 20 %. Nemám důvod mu nevěřit. A 20% variabilita je docela úzká a rozdíly podle grafů velmi malé (podívejte se výše), rychle konvergují k deterministickému výsledku.

(EDIT: Teď jsem pochopil, že jsem se asi špatně vyjádřil, resp. jste si to přeložil jinak, než jsem chtěl. Ta věta "Balíček 100 minut je stále výhodný, pokud je má spotřeba úzce rozložena kolem 100 minut" má znít "Balíček 100 minut je výhodný i pro průměrnou spotřebu 100 minut, je-li spotřeba rozložena úzce". To byl komentář na Váš komentář.)

Vaše poznámka je spíše myšlena tak, že ten druhý graf, co má maxima rozložena úzce kolem kulaté hodnoty, je graf pro kulatou spotřebu. Myslíte to tak? No, ale to ten graf nezobrazuje. Na vodorovné ose jsou všechny možné průměrné spotřeby do 8 hodin (grafy na ifon.cz nemají na této ose průměrný čas, ale konkrétní čas). Ty největší rozdíly jsou nakupeny kolem průměrné spotřeby, jež odpovídá volným minutám. A ano, aby člověk pocítil rozdíl od deterministického a pravděpodobnostního výpočtu (to tady celou dobu řešíme), musí splnit podmínky, že jeho průměrná spotřeba bude právě rovna (nebo blízká) poskytnutým volným minutám a zároveň variabilita (rozptyl) spotřeby musí být širší. Pak ten rozdíl oproti "naivnímu" výpočtu je dán tím, že jelikož je spotřeba rozplizlá do stran, některé měsíční spotřeby byly citelně vyšší než poskytnuté volné minuty, a proto v některé měsíce člověk zaplatil více (protože volal více). Takže, jak říká Noneis, vy si v kalkulačce navolíte spotřebu kolem 50 minut, dostanete nějakou cenu, jenže ta bude trošku jiná než v právě zmíněném případě: protože člověk často volal vysoce nad 50 minut. A jelikož je rozptyl vyšší, častokrát měl spotřebu pod 50 minut. V průměru to bylo sice 50 minut, ale vzhledem k tomu, že člověk volal i víc, zaplatí o trošku víc. Nemůže zaplatit stejně, protože když volá méně, neplatí méně, protože má k dispozici volné minuty a za ty platí konstantě, byť volá méně. Ale aby takový rozdíl byl znatelný, musí se účastník trefit do zmíněných podmínek (viz druhý graf). V opačném případě (a že těch je mnohem víc) neexistuje citelný rozdíl v ceně vypočtené dvěma způsoby, o kterých se tady celou dobu bavíme. Viz grafy.

Číselně třeba takto: máme třeba ten Kaktus 100, průměrnou spotřebu třeba 56 minut. Kaktus dává 50 minut volných. Podle výpočtů z aplikací na ifon.cz pro tuto spotřebu vyjde cena 115 Kč. Jelikož Noneis má variabilitu volání 20 % a spotřebu 56 minut má jako průměrnou, nevyjde mu 115 Kč, nýbrž jeho průměrná útrata mu dle jeho přístupu vyjde na 120 Kč. Jelikož mu někde zmizlo 5 Kč, je naštvaný na ifon.cz, že ten mu sliboval útratu 115 Kč. Zatím váhá, jestli se takový risk může vyplatit. Pan Soukup také uvažuje, že si pořídí Kaktus 100. Jeho průměrná spotřeba je 90 minut, je ukecanější. Má také variabilitu 20 %. Když dal do kalkulačky na ifon.cz spotřebu 90 minut, zjistil, že ho volání bude stát 200 Kč. Noneis mu ale říká, že ifon.cz je naivní, protože jeho vlastní přístup mu ukazuje, že neutratí 200 Kč, ale v průměru celých 200.2 Kč. Pan Soukup poděkuje za vyjasnění a koupí si kartu Odoriku, protože tam za tutéž spotřebu zaplatí zhruba stovku.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od xsouku04 » úte 29. črc 2014 10:09:52

Děkuji za vysvětlení. Nemyslím to jako kritiku něčí práce, spíše se snažím dopátrat toho, jak je to doopravdy.
Balíček 100 minut je stále výhodný, pokud je má spotřeba úzce rozložena kolem 100 minut.
Myslím, že téměř nikdo nemá spotřebu úzce rozloženu kolem nějakého počtu minut. Natož takto kulatého počtu minut.

Pokud balíček není nijak supervýhodný, měl bych si jej brát jen do počtu minimálně provolaných minut.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od alfi » úte 29. črc 2014 8:56:00

xsouku04 píše: Bohužel ale tohle chyba, kdy si lidé vyberou balíček podle průměrné dlouhodobé spotřeby, může být celkem typická.
Tato velká část lidí, pokud hodlají udělat tuhle chybu a nechtějí nuceně zvýšit množství provolaných minut (pro jistotu), by si opravdu měla představovat graf poněkud zaobleně v neprospěch balíčků.
já bych se řídil spíše minimální než průměrnou spotřebou. klidně např. za prázdninový měsíc/měsíce, kdy je uživatel třeba v zahraničí a moc nevolá nebo volá za jiné sazby/balíčky. to je hranice, kdy se balíčky/volné minuty určitě vyplatí (podobně to platí i pro data) a zároveň mu nižší pravidelná platba "vydělává" na měsíce, kdy to minimum přesáhne. samozřejmě s ohledem na ten rozptyl.

jinak u uzavřených skupin typu rodina = často volající mezi sebou, je důležitý i celkový provoz za všechny účastníky skupiny. aneb jeden hodně volající + 3 málo, můžou mít v součtu u stejného operátora menší útratu, než kdyby ten hodně volající byl jinde (např. neomezený paušál u velké trojky) a ostatní mu volali do cizí sítě.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od Olaf » úte 29. črc 2014 3:03:28

xsouku04 píše: Pokud měsíčně provolám průměrně třeba 100 minut, je pro mne balíček se 100 minutami velmi nevhodný...
Nikoli. To je jen půlka pravdy. Balíček 100 minut je stále výhodný, pokud je má spotřeba úzce rozložena kolem 100 minut. Pokud je rozplizlá, pokud má spotřeba má velký rozptyl, pak už výhodný nemusí být. Otázkou pak může být, zda operátor nabízí tarif, který mi bude vyhovovat. A zda bude vyhovovat i změnám v mé spotřebě.
xsouku04 píše: Čím více se liší provolaný počet minut mezi jednotlivými měsíci, tím více nebezpečný pro mě balíček je.
Kdyby na svislé ose byly miliony a ne jednotky korun, pak by byl nebezpečný a celá situace by byla hodna dlouhých, časově náročných výpočtů. A rád by si na výsledek počkal i klient. ;-) Tarifikační míra zde hraje stále mnohem větší roli. Pokud je u třetiny mého volání spotřeba nižší než volné minuty, pak bych mohl uvažovat o změně tarifu. Viz výše. Ale to jde vidět i z deterministických výpočtů.
xsouku04 píše: Tato velká část lidí, pokud hodlají udělat tuhle chybu a nechtějí nuceně zvýšit množství provolaných minut (pro jistotu), by si opravdu měla představovat graf poněkud zaobleně v neprospěch balíčků.
Nikoli, záleží na rozptylu (mrkněte znova na graf 2). A stejně ani tak si nebudou schopni zaoblení představit (to nedokáže nikdo bez výpočtů -- ostatně i tyto výpočty, byť sebepřesnější (sebesložitější), jak to zde navrhuje kolega (a dokáži si představit ještě složitější), stojí na nutných [velkých] zjednodušeních. A tento postup nedává žádný jasný přehled o odchylce; snad mě někdo opraví ;-)). A co je hlavní, ty grafy na ifon.cz včetně kalkulačky jsou hlavně srovnávací. Nejde o projekt internetové křišťálové koule: náš vesmír není deterministický (to jsem zvědavý, kdo toto použije proti mě, haha...). Přesto srovnání platí. A platí s velkou přesností i uvedené výsledky. Jestliže někdo dokáže nepřesnost kalkulačky, i v dlouhodobém horizontu, rád modely upravím. Zatím to jsou jen jakoby akademické řeči. Sám vidíte ty titěrné rozdíly. A podmínky, které musejí být splněny, aby rozdíly byly znatelné. Navíc, jak jsem řekl, ty grafy, pro tarifikační míry odlišné od 1+1, nejsou obaleny do pásu +/- sigma (to můžu klidně udělat). Co jsem mohl vysvětlit, jsem vysvětlil. Skutečně nevím, jak jinak to vysvětlit.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od xsouku04 » úte 29. črc 2014 0:14:19

Děkuji za rozbor a vysvětlení.

Pokusím se to zase přebrat.

Pokud měsíčně provolám průměrně třeba 100 minut, je pro mne balíček se 100 minutami velmi nevhodný, protože dost pravděpodobně mě každý druhý měsíc nějaké minuty propadnou, což mi výrazně a dlouhodobě zvýší celkovou cenu za minutu.
Čím více se liší provolaný počet minut mezi jednotlivými měsíci, tím více nebezpečný pro mě balíček je.
Bohužel ale tahle chyba, kdy si lidé vyberou balíček podle průměrné dlouhodobé spotřeby, může být celkem typická.
Tato velká část lidí, pokud hodlají udělat tuhle chybu a nechtějí nuceně zvýšit množství provolaných minut (pro jistotu), by si opravdu měla představovat graf poněkud zaobleně v neprospěch balíčků.

Pokud si ale pořídím balíček jen s 50 minutami, pravděpodobnost toho, že mi nějaké minuty propadnou, je už podstatně nižší, téměř zanedbatelná. Leda, že by byla moje potřeba volání hodně nepravidelná ...

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od Olaf » pon 28. črc 2014 19:57:21

Dobrý den,
nebudu reagovat na vše -- pokud ne všechno, tak většinu toho podstatného jsem vysvětlil dříve. A začínáme se skutečně točit v kruhu.

Takže ještě jednou ve zkratce: v grafech (na ifon.cz) je na vodorovné ose _reálný_ provolaný čas. Tedy takový čas, který účastník opravdu provolá. Jenže jak víme, není to čas, který účtuje operátor. Účtovaný čas závisí na tarifikační míře a její vliv na čas/cenu není konstantní, odvíjí se od dalších věcí. Tenhle vliv kalkulačka na ifon.cz počítá (na rozdíl od jiných kalkulaček) pro zadané vstupy, resp. počítá s typickými hodnotami, pokud uživatel nechce situaci komplikovat a netuší, co má dělat. Toto navýšení je promítnuto do ceny, která je na svislé ose. Jednodušeji to už říct nedokáži.

S "průměrnými" cenami za rok či dva nepočítá. Jsou k tomu jisté důvody (například i ten, že analýza faktur měla být původně vlastní prémiovou službou pro klienta, který to chce a je ochoten zaplatit za službu -- to by mne třeba zajímalo, jestli by toho pan Noneis využil). Ostatní důvody jsem zmínil dříve a některé dovysvětlím níže. Opět připomínám, že přehršel formulářů a nutných vstupů od návštěvníka by snížil interakční schopnosti s takovou kalkulačkou (mimochodem už teď někteří lamentují nad tím, že musejí do vstupu těch jednoduchých aplikací dávat něco, o čem prý nic neví; že tam mají jednodušší, základní verzi, snad přehlížejí :) Jinými slovy, když dáte lidem možnost přesnějšího výpočtu, jak je i teď na ifon.cz, někteří začnou naříkat, že je to moc složité a jinde jsou kalkulačky snadnější na obsluhu. Pak se nedivme komerčním úspěchům kalkulaček, které nedávají správné výsledky ani pro tarify s tar. mírou 1+1 -- protože tam se uživatelský vstup ořezává na až absurdní minimum a zbytek se tahá z klobouku).

Pro pana Noneise :) Ten škálový faktor mám dobře, vždyť je odvozen přímo z normovací podmínky, máte to tam uvedeno celé. Vy na mě tady vždy vytáhnete nějaký konkrétní výsledek či vztah, aniž byste řekl, co vlastně je zač a jak jste ho odvodil. Reverzní inženýrství bývá sice někdy zábavné, ale jen v tom případě, že z toho člověk má nějaký užitek -- což zde není splněno, je to jen přetahovaná o nic. Mě poněkud unavuje se v tom opakovaně piplat a zkoumat, co jste vlastně chtěl říct. Sedět u piva, problém vyřešíme za pár minut a už se o tom více nebude bavit, v tom jsou diskusní fóra jiná. Proto ale vždy volte obecnou cestu -- to, co jste u mě nazval zbytečným povídáním (důkazy). Ono se pak lépe replikuje tvrzení. Od oka hádám, že jste nechtěl říct, že integrál z hustoty pravděpodobnosti není jednička (protože očividně je), ale že striktně vzato střední hodnota "spotřeby" není pak stejná jako vstupní hodnota u původního NR. Je to pravda? Pokud ano, tak jsem nikde netvrdil, že z matematického hlediska mu a sigma starého (kompletního) NR(t, mu, sigma^2) je střední hodnotou a disperzí nového (useknutého) NR. Tam se to trošku posouvá, což je jasné. Vzhledem k tomu, jakým způsobem nejdříve získáváte mu a sigma a co za předpoklady používáte, je to zcela jedno.

Jinak k těm rozdílům mezi přímým deterministickým výpočtem a střední hodnotou spotřeby rozloženou mezi měsíce ještě pár poznámek. Graf níže ukazuje různé křivky pro sigma od 0.1*mu až 0.4*mu. Mám trošku pocit, že čtenáři ani moc neví, co to znamená, tak se to pokusím vysvětlit slovně.

Obrázek

Jako modelový příklad jsem vybral Kaktus 100, protože je jednoduchý (tarifikační míra 1+1, jednotná minutová sazba, jasně dané volné minuty). Za 100 Kč má člověk k dispozici 50 minut volání. Fajn. Přístup, který zastává Noneis, pak vypadá takto:

Co znamená, že mám sigma = 0.2*mu? Že "rozptyl" (přesněji střední kvadratická odchylka) mých provolaných minut za vybrané období (třeba těch 12 měsíců) je nějakých 20 procent průměrné časové spotřeby. Jinými slovy, pokud si zprůměruji provolané minuty za 12 měsíců a zjistím, že například průměrně volám 70 minut měsíčně, pak variabilitu této spotřeby mi udává sigma, která zde činí oněch 20 % z průměrné spotřeby, takže spotřebu můžu zapsat jako 70 +/- 14 minut (samozřejmě, že v reálu to uděláte naopak: z provolaných minut získáte průměr a střední kvadratickou odchylku). Fajn. Podívejme se na graf: pro průměrnou spotřebu 70 minut neexistuje žádný viditelný rozdíl mezi tím, co a jak jsme počítali (deterministický "naivní" výpočet vs. pravděpodobnostní). Mám-li totiž spotřebu 70 +/- 14 minut a operátor mi dává 50 volných minut, mé chování je rozumné a jednotky vyčerpávám (využívám výhodnost nabídky), viz zelená křivka.

Přeskočme rovnou na sigma = 0.4mu. Na grafu jsou jisté rozdíly patrné. Co to znamená 0.4mu? Že tentokráte má spotřeba činí 70 +/- 28 minut. Rozptyl už je vyšší. A protože počítám cenu z času více rozplizlého do stran, průměrná cena se začne měnit. I přesto pro 70 minut je rozdíl pořád malý. Horší už je, když moje průměrná spotřeba bude o něco menší, třeba 60 minut při stejném rozptylu. 60 +/- 24 minut... Jinými slovy, častokrát balíček nevyčerpám (spotřeba nižší než 50 minut zde mít zastoupení 33 %). Proto se pro mě nemusí hodit (ve třetině případů balíček nevyužiji celý). Chování účastníka začíná být trošku nerozumné.

Nyní již máte dostatek indicií, abyste mohli vydedukovat, jak to bylo doopravdy ;-) Pro ještě lepší ilustraci si ukažme graf zobrazující procentuální rozdíly mezi deterministicky určenou cenou a cenou střední, která se počítá pravděpodobnostně. Je to táž situace, ale teď se na ni díváme z jiného úhlu.

Obrázek

Na první pohled vidíme dramatickou změnu: ale jen v jistém okolí určitého času a jen v určitých případech: rozdíly (udávané v procentech) nám "rezonují" v úzkém okolí určité spotřeby, ale pak rychle klesnou k nevýznamným hodnotám. No a není překvapením, že tou spotřebou je objem volných minut. Bude-li naše průměrná měsíční spotřeba balancovat na okolí poskytnutých volných minut, můžeme dostat znatelnější rozdíly: ale opět jen a tehdy, pokud je zároveň naše spotřeba rozplizlá: je-li naše měsíční spotřeba třeba 50 +/- 20 minut. Vzhledem k tomu, že máme k dipozici 50 volných minut, se pak nemůžeme divit, že pokud čerpáme pravidelně jen do 40 minut, zaplatíme jako za více minut... (s těmito parametry tvoří spotřeba do 40 minut třetinu případů) (EDIT: je potřeba si uvědomit, že jelikož je spotřeba rozplizlá oběma směry, tedy i do vyšších spotřeb, zaplatíme v průměru víc, protože jsme v některých měsících volali citelněji víc než 50 minut.). Nevyčerpám-li volné jednotky a je-li moje spotřeba pod touto hranicí, pak pro mě takový tarif nemá smysl. Ale k takovému závěru nepotřebuji takto složitý přístup k výpočtům. Ostatně opět platí, že si můžu vzít průměrnou časovou spotřebu (kterou už tedy znáte), zadat ji do kalkulačky a dostanete výsledek: který bude téměř vždy stejný jako při deterministickém výpočtu: výjimkou bude jen situace, kdy průměrně volám tolik minut, kolik činí balíček volných minut, a navíc pokud moje volání má vysokou variabilitu (vysvětleno před chvilkou).

Takže ten graf, který od ruky načrtl pan Soukup, kde je rozdíl mezi deterministickým přístupem a pravděpodobnostním 100 Kč v okolí času odpovídajícího volným minutám, je skutečně nesmyslný. Ty rozdíly jsou i v tomto okolí mnohem mnohem menší (viz grafy v tomto příspěvku).

A ještě jeden graf, který je stejný jako ten první: jen je zobrazen do 8 hodin spotřeby, jak to je na mnoha místech aplikací na ifon.cz včetně profilů operátorů:

Obrázek

Použít širší křivku, návštěvník okem neuvidí žádný rozdíl. Tím neříkám, že balíčky jsou supervýhodné pro každého. Nejsou, fajn. Jsou situace, kdy však jsou výhodné; a někteří operátoři to mají nastaveno tak blbě, že i nejdražší tarif s největším počtem volných minut je nejméně výhodný, naopak nejlevnější tarif/balíček s nejmenším počtem minut je nejvýhodnější i při vysoké spotřebě. To lze vidět ale i bez tohoto přístupu.

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od xsouku04 » ned 20. črc 2014 18:32:22

Děkuji Noneisovi za jeho argumenty.
Jakékoli pravděpodobnostní rozložení včetně normálního rozložení (NR) bude přesnější než nepoužít žádné.
Silný ale přitom jednoduchý a zjevně pravdivý argument. Také mě to mohlo napadnout :) Možná jsem to už někde slyšel.
Vaše kalkulačka uvažuje korelaci = 1, tedy nemůžete v ní uvažovat nic jiného než konkrétní měsíc. Jasně, že při nesmyslném předpokladu korelace=0 je proložení 12 bodů NR nesmysl, ale korelace je kladná, takže už jde jen o to jakou to bude mít odchylku. Možná velkou, možná malou (nemám data), ale mělo by to být přesnější než ten "naivní" výpočet. Každopádně uživatel by dostal výchozí korelaci stejně jako máte výchozí počet hovorů kratších než jedna minuta.
Tedy pokud vím, kolik minut jsem provolal v minulých účtovacích obdobích, mohu s jistou pravděpodobností odhadnout, kolik minut to bude následující měsíc. Nebude to úplně náhodné číslo, ale pravděpodobně se to bude blížit počtu obvyklých minut z předchozích měsíců. Tedy dá se i spočítat, s jakou pravděpodobností se bude počet provolaných minut lišit třeba o 30% oproti průměrné hodnotě s předchozích měsíců - tedy "výhodný" balíček už nebude tak výhodný i když průměrná měsíční spotřeba minut zůstane nezměněna - a to možné promítnout do grafu.

Tedy zdá se, že opravdu platí:
I tahle vylepšená kalkulačka uměle zvýhodňuje balíčky. Neuvažuje totiž o spotřebě pravděpodobnostně, pouze o délce hovorů. Tady je pak vidět, že pravděpodobnostní rozdělení nepoužívají. Dejte si třeba odorik a tesco club card. U odoriku by neměl být skok, ale hladký přechod. U tesca by měla být tak křivka zakulacená. ještě pořád tahle vylepšená kalkulačka uměle zvýhodňuje balíčky. Neuvažuje totiž o spotřebě pravděpodobnostně, pouze o délce hovorů. Tady je pak vidět, že pravděpodobnostní rozdělení nepoužívají. Dejte si třeba odorik a tesco club card. U odoriku by neměl být skok, ale hladký přechod. U tesca by měla být tak křivka zakulacená.
Přikládám obrázek, který to ilustruje.

Tedy pokud bych měl Tesco Mobile Club Card 200 - tedy myslím, že musím dobít každý měsíc 200 Kč, abych měl tyto ceny a výhody, a volal převážně mimo síť Tesca a průměrně provolal 2 a 3/4 hodiny měsíčně, pořád mi výhodněji přijde Odorik.cz.
Protože občas prostě provolám třeba jen 1,5 hodiny a občas 3,5 hodiny a průměrně utratím to, co je vyznačeno červeně. Jak moc bude červená křivka prověšená, to záleží na tom, jak moc se liší moje jednotlivé měsíce, což je bohužel těžko uchopitelná veličina pro běžného laika, která se může mezi uživateli výrazně lišit. Asi by bylo fér vzít průměr všech uživatelů v ČR, ale ta data nemáme.
Pravda ale je, že velmi podobně špatně představitelný a pro běžné uživatele špatně uchopitelný je počet hovorů pod jednu minutu a počet velmi dlouhých hovorů - tam ale jakési "průměrné" chování autor kalkulačky předpokládá z nějakého vzorku dat, které má k dispozici.

Jinak by to mohla být velmi zajímavá diplomová práce pro nějakého matematika/statistika :)

V každém případě kalkulačka ifon.cz je stále to nejlepší, co existuje. A představit si zaoblení hran v neprospěch balíčků není tak náročné - pokud o tom víme.
Přílohy
Nevýhodné_balíčky.png
Nevýhodné_balíčky.png (39.48 KiB) Zobrazeno 12778 x

Re: Porovnání cen Odorik s jinými - zajímavá cenová kalkulač

od noneis » ned 20. črc 2014 13:05:25

Olaf píše:Dobrý den,
pokusím se reagovat na některé poznámky, které se zde objevily. Nebudu to dělit na více příspěvků (později asi ano, pokud budu reagovat na něco dalšího), takže to bude dost dlouhé. Ale zatím k prvnímu diskutujícímu.
No a mě zase nezajímá kolik stojí 100 minut, ale kolik celkem utratím. Na to kolik stojí 100 minut se můžu kouknout do ceníku.
A v tom se právě mýlíte. Cenu sta minut volání vám žádný ceník operátora nesdělí, jen s výjimkou těch, co mají tarifikaci 1+1. Právě proto existuje kalkulačka na ifon.cz. Jestliže má operátor 100 min. za N Kč, neznamená to, že za N Kč provoláte opravdu 100 minut. Reálně to může být i 50 min, nebo více, nebo méně...
Ok, to máte pravdu. Člověk to může jen odhadnout. No a nyní k vašim dalším poznámkám.

1.) Matematická část
Olaf píše:Oba se zde bavíme patrně o něčem jiném. V kalkulačce se cena počítá -- pro konkrétní vstup -- deterministicky (to, že jsou na jiných místech použity zhusta pravděpodobnostní modely, je věc jiná). Klient si navolí konkrétní spotřebu a pro tu dostane konkrétní cenu. Takto může srovnávat nabídky. U tarifů s jinou než sekundovou tarifikací vstupuje do hry střední hodnota relativního navýšení času (vliv tarifikační míry). Výchozím bodem je střední hodnota délky hovoru. Relativní navýšení ceny v důsledku tarifikační míry různé od 1+1 zavádí do výsledku určitou nejistotu -- nakonec, pokud střední hodnotu ceny obalíte do pásu -sigma/+sigma, neřkuli |2*sigma|, do pásu si můžete klidně zapasovat libovolné zakulacené křivky. ;-) Cena se chová však lineárně.
Jistě že se bavíme o něčem jiném, vy v kalkulačce počítáte útratu za konkrétní měsíc, já se bavím o průměrné útratě za měsíc. Cena se většinou chová lineárně opět pouze pro daný měsíc. Každému bude vyhovovat něco jiného, podle toho co chce zjišťovat. Já se domnívám že většina lidi chce vědět kolik průměrně utratí. I pokud to tak není, tak se jistě najde nezanedbatelná skupina lidí kteří to chtějí.
Olaf píše: Jestliže klient Odoriku v daném období dosáhne útraty 100 Kč a volá dál, celková cena za volání se sníží, protože se odpouští poplatek za SIM. To chápeme všichni. ;-) Nespojitost zde prostě je, cena skočí dolů. To je to, čemu vy říkáte "naivní" výpočet. Já nevím, co je na tom naivního. Funkce s jednou skokovou nespojitostí v bodě, kde se limita zleva nerovná limitě zprava, jsou úplně běžné funkce a jejich výskyt není známkou ani punku ani hlouposti.
Nastudujte si princip jak se u odoriku účtuje paušální poplatek. Nejenom že tohle by i při měsíční účtování poplatku platilo jen pro konkrétní měsíc (který právě vaše kalkulačka počítá), ale tohle vzhledem k dennímu účtování vůbec neplatí. Zapomněl jste, že v každém bodě je tahle funkce závislá na sumě všech hodnot funkce za posledních 30 dní. Proto tam nemusí být pouze jedna nespojitost, ale může jich tam být i víc. Proto sem psal, že je to "naivní" výpočet. "naivní" chápu jako použíti nějaké jednoduché verze výpočtu, která nepokrývá všechny souvislosti. A všechny jste skutečně nepokryl. :)
Olaf píše: K vašemu "zakulacení" a "zvlnění" trošku podrobněji. Hádám, že asi žádný z diskutujících Váš výsledek neověřil a nevygeneroval si vlastní křivky. Nechte mě proto trošku vysvětlit ostatním, co jste chtěl říct. Předpokládáte, že během roku je Vaše měsíční spotřeba minut rozdělena normálně, proto k výpočtu používáte Gaussovo normální rozdělení pravděpodobnosti, přičemž náhodou proměnnou je právě měsíční spotřeba.
Přitom Váš výpočet v jistém okolí kolem T0 (času, jenž odpovídá volným minutým, resp. času, kdy dochází k odpuštění poplatku za SIM) -- popř. na širším intervalu, je-li sigma vyšší -- ukazuje odchylky od lineární funkce. Fajn. Ty odchylky jsou sice titěrné, ale budiž. V roce máte 12 měsíců, máte dvanáct bodů, dvanáct hodnot. Takto nízký počet měření nelze proložit normálním rozdělením, ne v tomto případě (resp. není k tomu důvod). U řady měřených veličin to lze, jsou-li pro to fyzikální důvody: má-li měřená veličina "tu správnou hodnotu", kterou se snažíte zjistit. Chyby měření jsou pak rovnoměrně rozloženy kolem této hodnoty (střední, očekávané hodnoty). V případě měsíčních spotřeb žádná "správná" hodnota neexistuje. Každý měsíc může mít klient libovolnou spotřebu, spotřeba z minulého měsíce nesouvisí se spotřebou v dalším měsíci. Ano, někdo může volat velmi podobně každý měsíc, pokud toto volání je řízeno nějakým plánem.
Zde jste použil jeden zásadní a nesprávný předpoklad. A to, že použití normálního rozdělení(NR) v ilustračním grafu znamená, že se to má takhle počítat v praxi. Ve svém prvním příspěvku sem psal "pravděpodobnostní rozdělení" a to právě z důvodu, že NR nemusí být zas tak přesné, ale slouží jako výborná ilustrace. NR jsem použil až na graf pro pana Soukupa, aby viděl jak to zhruba vypadá. Nenacházíte se zde totiž na matematickém fóru ale na fóru o telekomunikacích. Použité PR by mělo být jiné pro každou osobu, ale to není v praxi proveditelné, proto by se mělo zvolit nějaké typické PR, jestli to bude NR, nebo nějaké šikmé PR či bude mít dokonce více lokálních maxim záleží na typickém uživateli, každopádně téměř jakékoliv pravděpodobnostní rozdělení včetně NR bude přesnější než nepoužít žádné.

Odchylky jsou pro odorik skutečně malé, ale pro balíčky už ne a obzvláště pokud se využijí minuty v síti.

Spotřeby minut v jednotlivých měsících na sobě záleží, zcela jistě mají kladnou korelaci. Kdyby byla korelace 0, jak tady tvrdíte ("spotřeba z minulého měsíce nesouvisí se spotřebou v dalším měsíci."), tak by jakékoliv paušály naprosto postrádali smysl. Člověk by pak téměř žádným způsobem nemohl predikovat kolik provolá. Vaše kalkulačka uvažuje korelaci = 1, tedy nemůžete v ní uvažovat nic jiného než konkrétní měsíc. Jasně, že při nesmyslném předpokladu korelace=0 je proložení 12ti hodnot NR nesmysl, ale korelace je kladná, takže už jde jen o to jakou to bude mít odchylku. Možná velkou, možná malou (nemám data), ale mělo by to být přesnější než ten "naivní" výpočet. Každopádně uživatel by dostal výchozí korelaci stejně jako máte výchozí počet hovorů kratších než jedna minuta.
Olaf píše: Jinými slovy, do výpočtu jste uměle zanesl další komplikaci a nutné (ne nutně správné) předpoklady a další stupně volnosti. Vy uvádíte, že Vaše spotřeba se řídí normálním rozdělením s jistými momenty, znáte svou střední spotřebu i střední kvadratickou odchylku (počítáte s 0.2*mu). Fajn. Držíte-li se tohoto N let, nic moc nenamítám. U lidí se ale chování mění: s tím, jak se mění ceny, s tím, jak pracují atd. Mám zde dataset ze zhruba 2000 SIM karet. Když se podíváte na spotřebu v roce, mluvit o normálním rozdělení nejde. Když člověk provede přímočarý výpočet průměrné spotřeby, spočítá střední kvadratickou odchylku, zjistí, že v tomto případě (pro 2000 SIM karet) je mean(sigma) = 0.43 mu. Takže rozptyl je u 2000 SIM karet daleko vyšší než u Vás (0.2mu). Medián je podobný, asi 0.41mu. Maximální sigma činí asi 3.5mu (sic!), minimální pak 0.1mu.
Pořád předpokládáte že bych použil NR i naživo (nemám data, tak nevím co bych použil). Na tom že každý má sigmu jinou se shodneme, nikde ale netvrdím, že by tomu tak nebylo. A potvrdil jste tu existenci proměnlivosti spotřeby.
To, že se chování lidí mění je přeci další argument k tomu nevyužívat balíčky, zvyšuje to sigmu (a mění mu). Používáte ten argument zcela obráceně.

Dále máte ač krásné tak naprosto zbytečné věty s důkazy oponující ilustračnímu grafu pro pana Soukupa. Korekční člen jsem zanedbal protože sigma bylo 0.2*mu, a protože pravděpodobnost, že náhodná veličina pro takové sigma padne pod 0 je 2.87 * 10^-7, tak by byl rozdíl v grafu okem nerozeznatelný, nebyl důvod tedy korekční člen použít. Mám omezené množství času a nechci s ním plýtvat. Mimochodem tam máte ten korekční člen špatně a integrál z vaší hustoty pravděpodobnosti tedy není jednička. Konkrétně když přecházíte k integrálu t*NR(t,mu,sigma) tak korekční člen bude mu / [mu - \int_{-\infty}^{0} t * NR(t; mu, sigma) dt ] Nemůžete takhle míchat dva různé integrály. Srovnejte správné řešení s tím vaším. ;) (např pro mu=100, sigma=60, odkazy jsou na wolframalpha.com)
Olaf píše: Takže nakonec bychom měli mít střední hodnotu ceny danou jako funkci dvou proměnných, a dostali bychom 3D graf škaredý jak pytel na zmije. K čemu to všemu? Abychom se chvástali korunovými rozdíly v malém intervalu času, přičemž bychom nakonec zjistili, že pokud je předpoklad NR správný a sigmy jsou malé, střední cena konverguje hezky k původní jednoduché lineární funkci, která má jediný bod, v němž neexistuje derivace? Skutečně?
Stěžujete si na 3D graf, takový graf ale nebudete vůbec konstruovat, uživatele to nezajímá. Vypočtete jen to co potřebují a to bude jen několik hodnot. V tom grafu jsou zajímavá data pro balíčky a nejedná se o korunové rozdíly, jak se zde snažíte tvrdit. (spočtěte si to) A sám jste na datasetu 2000 SIM karet zjistil, že sigmy malé nejsou.
A co se týče sigmy blížící se k nule, tak by se měl uvažovat fallbacku k té lineární funkci. Programování speciálních případů totiž většinou zabere více času než programování jádra problému. Speciální případy při implementaci nastávají velmi často.
Olaf píše: Navíc aby vznikl zaoblený graf bez ostrého přechodu (či v případě Odoriku bez nespojitosti), je nutné pro každou spotřebu s krokem +1 počítat uvedený vztah stále dokola až na konec intervalu, který si zvolíme (třeba od 1 minuty do 480 minut, což jsou zhruba limity kalkulačky; 480x musíte počítat zmíněný vztah s třemi integrály. Je na tom něco elegantního?
Nejsem si jistý o čem teď mluvíte, jaký vztah se třemi integrály máte namysli? Zmíněná 1D situace obsahuje 2 integrály.

2.) Aplikační část, webové stránky.
Olaf píše: Provést výpočet uvedený výše pro vybraný interval (tj. získat hodnoty střední ceny) trvá několik minut. Tento laptop je sice spíše el. psací stroj, server je rychlejší, ale to neomlouvá celou neohrabanost procedury: výpočet (sestrojení takového grafu) trvá pro 180 minut s tímto -- nyní skutečně -- naivním -- a přemrštěně složitým postupem sedm minut (více křivek; u jedné kolem minuty až dvou). Teď jsem použil slova "naivní" já -- protože používáte daleko divočejší předpoklady, než jsou v deterministickém modelu, který je jasně a logicky vysvětlitelný a pochopitelný. A správný.
Velmi by mě zajímalo jak jste došel k uvedeným hodnotám délky výpočtu. Uživatele nezajímá přesnost na velké množství platných cifer. Pokud něco programujete je vhodné použít takovou aproximaci, která s dostatečnou přesností vyhodnotí daný problém na celém uvažovaném definičním oboru, samotný výpočet je pak docela svižný. Takový 1D z korigovaného NR zvládne 1 jádro úsporného serverového CPU pod 1 μs.
Vámi uvedený výpočet (předpokládám, že máte na mysli 1D situaci, není to z vašeho vyjádření úplně zřejmé) s přesností na 7 platných cifer tedy trvá 0.18ms nikoliv 1-2minuty. Čas jste tedy nadstřelil půlmilionkrát. :)

Nikdo netvrdí, že by takové stránky měli být koncipovány jako ty vaše, ty výpočty jsou skutečně náročnější, ač ne tak, jak zde tvrdíte. Pokud budete chtít grafy, tak můžete omezit počet tarifů v grafech a nejčastější hodnoty cachovat.
Olaf píše: Nemluvě o tom, že neznám nikoho, kdo by si vedl záznamy o a) skutečných provolaných minutách, b) o účtovaných minutách, c) o měsíčních spotřebách a cenách. I kdyby takoví lidé existovali, a tvořili statisticky významnou skupinu, stejně by jim tento zmíněný postup nemohl pomoci: skutečně pomoci jim může jen to, co je na webu uvedeno.
Ono existuje něco jako vyúčtování, či dokonce elektronické vyúčtování, v kterých je počet účtovaných minut napsán, a vzhledem k tomu, že tam nejsou obvykle uvedeny skutečně provolané minuty tak se podle vaší logiky stává nepoužitelné především vaše pravděpodobnostní navýšení ceny podle hovorů kratších než minuta a najednou je lepší to odhadovat statickou hodnotou jako jiné kalkulačky. :D

Nahoru