Modelització estadística a Business Analytics amb R

Aquest bloc destaca el model estadístic de Business Analytics amb R



Anàlisi empresarial amb R.

L’objectiu principal de Business Analytics és desenvolupar nous coneixements sobre el negoci i avaluar el rendiment. S’ha parlat prou sobre Business Analytics i les seves diverses tècniques. El que més es requereix és una comprensió completa de com s’apliquen les estadístiques a Business Analytics.



Què és el modelatge estadístic?

El modelatge estadístic és la formalització de relacions entre variables en forma d’equacions matemàtiques. Bàsicament es tracta d’esbrinar la variable. Descriu com es relacionen una o més variables amb una o més variables. Aquí, les variables no estan relacionades amb precisió, però sí que es poden relacionar estocàsticament.

En termes més simples, una variable no és res més que un atribut. Un atribut es converteix en l’altura, el pes i l’edat d’una persona. L’alçada i l’edat són de naturalesa probabilística. Una persona de 30 anys té més possibilitats de mesurar 4 peus. De la mateixa manera, quan es té coneixement d’una persona que té 13 anys, té més possibilitats de mesurar 6 peus.



El propòsit complet del modelatge estadístic no consisteix en la investigació, sinó que en definitiva es tracta de proporcionar una visió de les solucions. Implica analitzar les dades i aplicar-les en diferents circumstàncies. Els temes tractats al vídeo són els següents:

1. Què és la modelització estadística
2. Què és el modelatge de regressió
3. Comprensió d'Analytics

Què és el model de regressió?

Com es va esmentar a les línies anteriors sobre modelització estadística, un model important i bàsic en aquesta teoria és el modelatge per regressió. El modelatge de regressió consisteix a obtenir la relació entre dues variables. Més concretament, la regressió ajuda a entendre com canvia el valor de la variable dependent mentre varia qualsevol de les variables independents, mentre que les altres variables independents es mantenen fixes. Per exemple, el temps és una variable independent, mentre que les vendes i la velocitat depenen de determinats factors. Per tant, l’objectiu és esbrinar la relació entre tots dos.



Hi ha certes equacions en el model de regressió, ja que és la regressió lineal, multivariant i logística. La regressió logística és similar a la regressió en què hi ha dues variables, per tant es classifica com a model estadístic probabilístic. S'utilitza per descriure els paràmetres d'un model de resposta qualitativa.

mongodb crea l'usuari per a la base de dades

Al diagrama esmentat al vídeo, la línia introdueix dos conceptes: un que està a la línia i l’altre que no. Els allunyats de la línia tenen un error. Aquesta és la distància entre el valor real (punts blaus) i el valor predit (la línia negra). L’objectiu del modelatge, ja sigui en qualsevol forma, és minimitzar aquests errors, que consisteix a intentar salvar la bretxa entre tots dos. Hi ha altres tècniques per entendre la teoria.

Comprensió de l’anàlisi en empreses

Tota l'operació de l'analítica es resumeix en 3 models simples: model predictiu, descriptiu i de decisió. Com el seu nom indica, permet comprendre el futur. Per exemple, el fracàs del sistema, la solvència i el frau pertanyen al model predictiu que està guanyant popularitat a nivell mundial. D’altra banda, hi ha models descriptius i de decisió que existeixen des de fa molt de temps. Un model descriptiu permet caracteritzar les dades, on es pot estimar el PIB i la taxa mitjana d’esperança de vida d’un país. També té un caràcter exploratori, on el client proporciona les dades i s’analitza el problema. Al client se li dóna una idea del problema i després s’utilitza el model de decisió després del qual es proposen algunes optimitzacions. El model té un objectiu que no és altra cosa que optimització.

Tens alguna pregunta? Esmenta’ls a la secció de comentaris i et respondrem.

Articles Relacionats: