Но какво всъщност е моделирането?

Най-общо може да се разглежда като представяне на явление или процес с обобщена математическа формакоято може да се използва, за да ни информира повече за връзката и възможните стойности на ненаблюдаваните величини.

Мислете за това по този начин,

Ние (човешките същества), животните и всички останали живи и неживи същества сме машини за данни — генерираме данни всяка секунда. Това варира от движенията, които правим, местата, които избираме да отидем за почивка, приятелите, които срещаме, вида на храната, която предпочитаме, филмите, които гледаме, и в крайна сметка всичко, което правим. Ние сме просто фабрики за данни, постоянно произвеждащи данни с буквално всяко решение, което вземаме.

За да можем да разберем и установим връзка между тези данни, ние изграждамемодели —които ни помагат да намерим общ модел в данните и да го изразим в математическа форма, която може да се използва за обяснение на появата на самите данни и да направим изводи за други точки от данни, които не можем да видим. (правете прогнози за бъдещето).

Върхът на айсберга.

Процесът на моделиране често се свързва с идиома „Върхът на айсберга“, което основно означава малката част от много по-голяма ситуация или проблем, който остава скрит. Когато само част от нещо може лесно да се наблюдава, но не и останалото, казваме, че частта е само върхът на айсберга.

Точно това е моделството. При моделирането ние се опитваме да използваме малките парчета данни, които са били наблюдавани (върхът на айсберга), за да разберем и да направим изводи за големия ненаблюдаван/неизвестен феномен (самия айсберг).

Байесово срещу честотно моделиране.

Има два основни подхода към статистическото моделиране, които се прилагат последователно за моделиране на набор от статистически проблеми от години. Това са байесовите методи и честотните методи.

Байесовият модел е статистически модел, който използва вероятност, за да представи цялата несигурност в рамките на модела, както несигурността по отношение на изхода, така и несигурността по отношение входа (параметрите) към модела.

От друга страна, честотният моделе статистически модел, който се основава на „честотната вероятност“, който третира „вероятността“ в еквивалентни термини на „честота“ и прави заключения от извадкови данни чрез подчертаване на честотата или дела на констатациите в данните.

Кой да взема?

Дебатът между байесовия и честолисткия подход е противоречив сред „моделистите“. С моите ограничени познания за двете, не съм в позиция да съветвам никого кой да избере. Вярвам, че е важно всеки да развие интуицията си и за двамата и сам да реши кое работи за него.

Аз лично започнах да уча байесово моделиране и го харесвам! Надявам се в близко бъдеще да открия и вълнуващи проблеми, които изискват да използвам модели на Frequentist.

Заключение:

В тази публикация разработихме основна интуиция за това какво всъщност представлява моделирането и накратко представихме двата общи модела в статистическото моделиране, които могат да се използват за моделиране на сложни проблеми от реалния свят.

В бъдещи публикации ще пиша повече за байесовите модели и как можете да създавате байесови двигатели за решаване както на еднопараметърни, така и на многопараметрични проблеми.

Моля, споделете своите мисли, въпроси и коментари относно тази статия!