Contacte

Aproximarea datelor experimentale prin metoda celor mai mici pătrate. Aproximarea datelor experimentale. Metoda celor mai mici pătrate. Cele mai simple cazuri speciale

Aproximarea datelor experimentale este o metodă bazată pe înlocuirea datelor obținute experimental cu o funcție analitică care trece cel mai aproape sau coincide în punctele nodale cu valorile inițiale (date obținute în timpul experimentului sau experimentului). În prezent, există două moduri de a defini o funcție analitică:

Prin construirea unui polinom de interpolare de n grade care trece direct prin toate punctele o matrice de date dată. În acest caz, funcția de aproximare este reprezentată sub forma unui polinom de interpolare sub forma lui Lagrange sau a unui polinom de interpolare sub formă de Newton.

Prin construirea unui polinom aproximativ de n grade care trece în imediata apropiere a punctelor dintr-o matrice de date dată. Astfel, funcția de aproximare netezește toate zgomotele (sau erorile) aleatorii care pot apărea în timpul experimentului: valorile măsurate în timpul experimentului depind de factori aleatori care fluctuează în funcție de propriile legi aleatorii (erori de măsurare sau instrumente, inexactitate sau experimentale). erori). În acest caz, funcția de aproximare este determinată folosind metoda celor mai mici pătrate.

Metoda celor mai mici pătrate(în literatura de limba engleză Ordinary Least Squares, MCO) este o metodă matematică bazată pe definiția unei funcții de aproximare, care este construită în cea mai apropiată apropiere de puncte dintr-o serie dată de date experimentale. Apropierea funcției inițiale și de aproximare F (x) este determinată de o măsură numerică și anume: suma pătratelor abaterilor datelor experimentale de la curba de aproximare F (x) ar trebui să fie cea mai mică.

Cele mai mici pătrate se potrivesc curbei

Se folosește metoda celor mai mici pătrate:

Să rezolve sisteme de ecuații supradeterminate când numărul de ecuații depășește numărul de necunoscute;

Pentru a căuta o soluție în cazul sistemelor de ecuații neliniare obișnuite (nu supradeterminate);

Pentru a aproxima valorile punctuale printr-o funcție de aproximare.

Funcția de aproximare prin metoda celor mai mici pătrate este determinată din condiția sumei minime de pătrate a abaterilor funcției de aproximare calculată dintr-o serie dată de date experimentale. Acest criteriu pentru metoda celor mai mici pătrate este scris ca următoarea expresie:

Valorile funcției de aproximare calculate la punctele nodale,

O serie dată de date experimentale la punctele nodale.

Criteriul patratic are o serie de proprietăți „bune”, cum ar fi diferențiabilitatea, oferind o soluție unică la problema de aproximare cu funcții de aproximare polinomială.

În funcție de condițiile problemei, funcția de aproximare este un polinom de gradul m

Gradul funcției de aproximare nu depinde de numărul de puncte nodale, dar dimensiunea sa ar trebui să fie întotdeauna mai mică decât dimensiunea (numărul de puncte) a unui anumit tablou de date experimentale.

∙ Dacă gradul funcției de aproximare este m = 1, atunci aproximăm funcția tabulară cu o dreaptă (regresie liniară).

∙ Dacă gradul funcției de aproximare este m = 2, atunci aproximăm funcția tabulară cu o parabolă pătratică (aproximare pătratică).

∙ Dacă gradul funcției de aproximare este m = 3, atunci aproximăm funcția tabulară cu o parabolă cubică (aproximație cubică).

În cazul general, când este necesară construirea unui polinom de aproximare de gradul m pentru valori tabelare date, condiția pentru minimul sumei pătratelor abaterilor pentru toate punctele nodale este rescrisă după cum urmează:

- coeficienți necunoscuți ai polinomului de aproximare de gradul m;

Numărul de valori specificate din tabel.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea cu zero a derivatelor sale parțiale în raport cu variabilele necunoscute ... Ca rezultat, obținem următorul sistem de ecuații:

Transformăm sistemul liniar de ecuații rezultat: deschidem parantezele și transferăm termenii liberi în partea dreaptă a expresiei. Ca urmare, sistemul rezultat de expresii algebrice liniare va fi scris în următoarea formă:

Acest sistem de expresii algebrice liniare poate fi rescris sub formă de matrice:

Ca urmare, s-a obținut un sistem de ecuații liniare de dimensiunea m + 1, care constă din m + 1 necunoscute. Acest sistem poate fi rezolvat folosind orice metodă de rezolvare a ecuațiilor algebrice liniare (de exemplu, metoda Gauss). Ca urmare a soluției, se vor găsi parametri necunoscuți ai funcției de aproximare care furnizează suma minimă a pătratelor abaterilor funcției de aproximare de la datele inițiale, i.e. cea mai bună aproximare pătratică posibilă. Trebuie amintit că atunci când chiar și o valoare a datelor inițiale se schimbă, toți coeficienții își vor schimba valorile, deoarece sunt complet determinați de datele inițiale.

Aproximarea liniară a datelor inițiale

(regresie liniara)

Ca exemplu, luați în considerare metoda de determinare a funcției de aproximare, care este specificată ca o relație liniară. În conformitate cu metoda celor mai mici pătrate, condiția pentru suma minimă a pătratelor abaterilor este scrisă în următoarea formă:

Coordonatele punctelor de grilă ale tabelului;

Coeficienți necunoscuți ai funcției de aproximare, care este dat ca relație liniară.

O condiție necesară pentru existența unui minim al unei funcții este egalitatea la zero a derivatelor sale parțiale în raport cu variabilele necunoscute. Ca rezultat, obținem următorul sistem de ecuații:

Transformăm sistemul liniar de ecuații rezultat.

Rezolvăm sistemul rezultat de ecuații liniare. Coeficienții funcției de aproximare în formă analitică se determină după cum urmează (metoda lui Cramer):

Acești coeficienți asigură construcția unei funcții de aproximare liniară în conformitate cu criteriul de minimizare a sumei pătratelor funcției de aproximare din valorile date din tabel (date experimentale).

Algoritm pentru implementarea metodei celor mai mici pătrate

1. Date inițiale:

O serie de date experimentale este dată cu numărul de măsurători N

Gradul polinomului de aproximare este dat (m)

2. Algoritm de calcul:

2.1. Se determină coeficienți pentru construirea unui sistem de ecuații cu dimensiunea

Coeficienții sistemului de ecuații (partea stângă a ecuației)

este indicele numărului coloanei matricei pătrate a sistemului de ecuații

Termeni liberi ai unui sistem de ecuații liniare (partea dreaptă a ecuației)

este indicele numărului de rând al matricei pătrate a sistemului de ecuații

2.2. Formarea unui sistem de ecuații liniare în dimensiune.

2.3. Rezolvarea unui sistem de ecuații liniare pentru a determina coeficienții necunoscuți ai polinomului de aproximare de gradul m.

2.4 Determinarea sumei pătratelor abaterilor polinomului de aproximare de la valorile originale pentru toate punctele nodale

Valoarea găsită a sumei pătratelor abaterilor este minimă posibilă.

Aproximare folosind alte funcții

Trebuie remarcat că atunci când se aproximează datele inițiale în conformitate cu metoda celor mai mici pătrate, o funcție logaritmică, o funcție exponențială și o funcție de putere sunt uneori folosite ca funcție de aproximare.

Aproximație logaritmică

Luați în considerare cazul în care funcția de aproximare este dată de o funcție logaritmică de forma:

Găsește aplicare largăîn econometrie sub forma unei interpretări economice clare a parametrilor săi.

Regresia liniară se reduce la găsirea unei ecuații de formă

sau

Ecuația formei permite valorile parametrilor date X au valorile teoretice ale indicatorului efectiv, substituind valorile reale ale factorului în acesta X.

Construcția regresiei liniare se reduce la estimarea parametrilor săi - Ași v. Estimările parametrilor de regresie liniară pot fi găsite prin diferite metode.

Abordarea clasică a estimării parametrilor de regresie liniară se bazează pe metoda celor mai mici pătrate(OLS).

OLS permite obținerea unor astfel de estimări ale parametrilor Ași v, la care suma pătratelor abaterilor valorilor reale ale atributului rezultat (y) din calculat (teoretic) minim:

Pentru a găsi minimul funcției, este necesar să se calculeze derivatele parțiale în raport cu fiecare dintre parametri. Ași bși setați-le la zero.

Notăm prin S, atunci:

Transformând formula, obținem următorul sistem de ecuații normale pentru estimarea parametrilor Ași v:

Rezolvând sistemul de ecuații normale (3.5) fie prin metoda eliminării succesive a variabilelor, fie prin metoda determinanților, găsim estimările necesare ale parametrilor. Ași v.

Parametru v numit coeficient de regresie. Valoarea acestuia arată modificarea medie a rezultatului cu o modificare a factorului cu o unitate.

Ecuația de regresie este întotdeauna completată de un indicator al strângerii relației. Când se utilizează regresia liniară, coeficientul de corelație liniară acționează ca un astfel de indicator. Există diverse modificări ale formulei coeficientului de corelație liniară. Unele dintre ele sunt enumerate mai jos:

După cum știți, coeficientul de corelație liniară este în intervalul: -1 1.

Pentru a evalua calitatea selecției unei funcții liniare, se calculează pătratul

Coeficient de corelație liniară numit coeficientul de determinare. Coeficientul de determinare caracterizează proporția varianței indicatorului efectiv y, explicată prin regresie, în varianța totală a trăsăturii efective:

În consecință, valoarea 1 - caracterizează proporția de dispersie y, cauzate de influenţa altor factori neluaţi în considerare în model.

Întrebări pentru autocontrol

1. Care este esența metodei celor mai mici pătrate?

2. Câte variabile sunt furnizate de regresie pereche?

3. Care este coeficientul care determină strânsoarea relației dintre modificări?

4. În ce limite se determină coeficientul de determinare?

5. Estimarea parametrului b în analiza corelației-regresiune?

1. Christopher Dougherty. Introducere în econometrie. - M .: INFRA - M, 2001 - 402 p.

2.S.A. Borodich. Econometrie. Minsk LLC „Noi cunoștințe” 2001.


3. R.U. Rakhmetova Curs scurt pe econometrie. Tutorial... Almaty. 2004. -78s.

4. I.I. Eliseeva, Econometrie. - M .: „Finanțe și Statistică”, 2002

5. Revista lunară de informare și analitică.

Modele economice neliniare. Modele de regresie neliniară. Conversia variabilelor.

Modele economice neliniare.

Conversia variabilelor.

Coeficientul de elasticitate.

Dacă există relații neliniare între fenomenele economice, atunci ele sunt exprimate folosind funcțiile neliniare corespunzătoare: de exemplu, o hiperbolă echilaterală , parabole de gradul doi si etc.

Există două clase de regresii neliniare:

1. Regresii care sunt neliniare în raport cu variabilele explicative incluse în analiză, dar liniare în raport cu parametrii estimați, de exemplu:

Polinoame de diferite grade - , ;

Hiperbola echilaterală -;

Funcția semi-logaritmică -.

2. Regresii care sunt neliniare în parametrii estimați, de exemplu:

Putere -;

Indicativ -;

Exponenţial -.

Suma totală a pătratelor abaterilor valorilor individuale ale trăsăturii efective la din medie se datorează influenţei mai multor motive. Să împărțim condiționat întregul set de motive în două grupuri: factorul x studiatși alti factori.

Dacă factorul nu afectează rezultatul, atunci linia de regresie de pe grafic este paralelă cu axa Ohși

Atunci întreaga varianță a trăsăturii efective se datorează influenței altor factori și suma totală a pătratelor abaterilor va coincide cu reziduul. Dacă alți factori nu afectează rezultatul, atunci ai legat Cu X funcțional și suma reziduală a pătratelor este zero. În acest caz, suma pătratelor abaterilor explicate prin regresie este aceeași cu suma totală a pătratelor.

Deoarece nu toate punctele câmpului de corelație se află pe linia de regresie, atunci împrăștierea lor are loc întotdeauna ca datorită influenței factorului X, adică regresie la pe X,și alte cauze (variație inexplicabilă). Adecvarea liniei de regresie pentru prognoză depinde de cât de mult din variația totală a caracteristicii la cade pe variația explicată

Evident, dacă suma pătratelor abaterilor datorate regresiei este mai mare decât suma reziduală a pătratelor, atunci ecuația de regresie este semnificativă statistic și factorul X are un impact semnificativ asupra rezultatului la.

, adică cu numărul de libertate de variație independentă a caracteristicii. Numărul de grade de libertate este asociat cu numărul de unități ale populației n și cu numărul de constante determinate din acesta. În raport cu problema studiată, numărul de grade de libertate ar trebui să arate câte abateri independente de la P

Estimarea semnificației ecuației de regresie în ansamblu este dată cu ajutorul lui F- Criteriul lui Fisher. În același timp, se propune o ipoteză zero că coeficientul de regresie este zero, adică. b = 0 și, prin urmare, factorul X nu afectează rezultatul la.

Calculul direct al criteriului F este precedat de analiza varianței. Loc central este nevoie de descompunerea sumei totale a pătratelor abaterilor variabilei la de la medie laîn două părți - „explicat” și „neexplicat”:

- suma totală a pătratelor abaterilor;

- suma pătratelor abaterii explicate prin regresie;

- suma reziduală a pătratelor abaterii.

Orice sumă de pătrate a abaterilor este legată de numărul de grade de libertate , adică cu numărul de libertate de variație independentă a caracteristicii. Numărul de grade de libertate este legat de numărul de unități din populație nşi cu numărul de constante determinate din acesta. În raport cu problema studiată, numărul de grade de libertate ar trebui să arate câte abateri independente de la P posibil este necesar pentru a forma o sumă dată de pătrate.

Dispersia pe grad de libertateD.

Raporturi F (criteriul F):

Dacă ipoteza nulă este adevărată, atunci varianțele factoriale și reziduale nu diferă unele de altele. Pentru Н 0, este necesară o infirmare, astfel încât varianța factorială să depășească de câteva ori rezidualul. Statisticianul britanic Snedecor a dezvoltat tabele de valori critice F-relaţii la diferite niveluri de semnificaţie ale ipotezei nule şi diferite grade de libertate. Valoarea tabelului F-criteriul este valoarea maximă a raportului varianțelor care poate apărea în cazul discrepanței lor aleatoare pentru un anumit nivel de probabilitate a prezenței unei ipoteze nule. Valoarea calculată F-relația este recunoscută ca de încredere dacă este mai mult decât tabelară.

În acest caz, ipoteza nulă a absenței unei legături între semne este respinsă și se face o concluzie despre semnificația acestei conexiuni: F fact> F tab H 0 este respins.

Dacă valoarea este mai mică decât tabelul F fapt ‹, F tab, atunci probabilitatea ipotezei nule este mai mare decât un nivel dat și nu poate fi respinsă fără riscul serios de a face o concluzie incorectă despre prezența unei conexiuni. În acest caz, ecuația de regresie este considerată nesemnificativă statistic. Dar nu se abate.

Eroarea standard a coeficientului de regresie

Pentru a evalua semnificația coeficientului de regresie, valoarea acestuia este comparată cu eroarea sa standard, adică se determină valoarea reală t- Criteriul elevului: care este apoi comparată cu valoarea tabelului la un anumit nivel de semnificație și cu numărul de grade de libertate ( n- 2).

Eroare standard de parametru A:

Semnificația coeficientului de corelație liniară este verificată pe baza mărimii erorii coeficient de corelație t r:

Varianta totală a unei trăsături X:

Regresia liniară multiplă

Construirea modelului

Regresie multiplă este o regresie a unei trăsături eficiente cu doi sau mai mulți factori, adică un model al formei

Regresia poate da un rezultat bun în modelare, dacă influența altor factori care afectează obiectul de cercetare poate fi neglijată. Comportamentul variabilelor economice individuale nu poate fi controlat, adică nu este posibil să se asigure egalitatea tuturor celorlalte condiții de evaluare a influenței unui factor investigat. În acest caz, ar trebui să încercăm să identificăm influența altor factori prin introducerea lor în model, adică să construim o ecuație de regresie multiplă: y = a + b 1 x 1 + b 2 +… + b p x p + .

Scopul principal al regresiei multiple este de a construi un model cu un număr mare de factori, determinând în același timp influența fiecăruia dintre ei separat, precum și efectul lor cumulativ asupra indicatorului modelat. Specificația modelului include două domenii de probleme: selecția factorilor și selectarea tipului de ecuație de regresie

3. Aproximarea funcției folosind metoda

cele mai mici pătrate

Metoda celor mai mici pătrate este utilizată la procesarea rezultatelor experimentale pentru aproximări (apropiere) date experimentale formula analitica. Forma specifică a formulei este aleasă, de regulă, din considerente fizice. Astfel de formule pot fi:

alte.

Esența metodei celor mai mici pătrate este următoarea. Lăsați rezultatele măsurătorii să fie prezentate în tabel:

masa 4

x n

y n

(3.1)

unde f - functie cunoscuta, a 0, a 1, ..., a m - parametri constanți necunoscuți, ale căror valori trebuie găsite. În metoda celor mai mici pătrate, aproximarea funcției (3.1) la dependența experimentală este considerată a fi cea mai bună dacă condiția

(3.2)

acesta este sume A pătratele abaterilor funcției analitice necesare de la dependența experimentală ar trebui să fie minime .

Rețineți că funcția Q numit discrepanţă.


Din moment ce rezidual

atunci are un minim. O condiție necesară pentru minimumul unei funcții a mai multor variabile este egalitatea la zero a tuturor derivatelor parțiale ale acestei funcții în raport cu parametrii. Astfel, găsirea celor mai bune valori ale parametrilor funcției de aproximare (3.1), adică acele valori pentru care Q = Q (a 0, a 1, ..., a m ) este minimă, se reduce la rezolvarea sistemului de ecuații:

(3.3)

Metodei celor mai mici pătrate i se poate da următoarea interpretare geometrică: într-o familie infinită de drepte de un tip dat, se găsește o dreaptă pentru care suma pătratelor diferențelor dintre ordonatele punctelor experimentale și ordonatele corespunzătoare ale punctele găsite de ecuația acestei drepte vor fi cele mai mici.

Găsirea parametrilor unei funcții liniare

Fie ca datele experimentale să fie reprezentate printr-o funcție liniară:

Este necesar să selectați astfel de valori a și b pentru care funcţia

(3.4)

va fi minim. Condițiile necesare pentru minimul funcției (3.4) se reduc la sistemul de ecuații:

După transformări, obținem un sistem de două ecuații liniare cu două necunoscute:

(3.5)

rezolvând care, găsim valorile cerute ale parametrilor a și b.

Găsirea parametrilor unei funcții pătratice

Dacă funcția de aproximare este dependența pătratică

apoi parametrii săi a, b, c se găsesc din condiția pentru minimul funcției:

(3.6)

Condițiile pentru minimul funcției (3.6) sunt reduse la sistemul de ecuații:


După transformări, obținem un sistem de trei ecuații liniare cu trei necunoscute:

(3.7)

la a cărei soluție găsim valorile cerute ale parametrilor a, b și c.

Exemplu ... Lăsați experimentul să rezulte în următorul tabel de valori x și y:

masa 5

y eu

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

Este necesară aproximarea datelor experimentale cu funcții liniare și pătratice.

Soluţie. Găsirea parametrilor funcțiilor de aproximare se reduce la rezolvarea sistemelor de ecuații liniare (3.5) și (3.7). Pentru a rezolva problema, vom folosi un procesor de foi de calcul Excela.

1. Mai întâi, să legăm foile 1 și 2. Să introducem valorile experimentale x i și y euîn coloane A și B, începând cu al doilea rând (în primul rând vom pune titlurile coloanelor). Apoi calculăm sumele pentru aceste coloane și le plasăm în al zecelea rând.

Coloanele C - G plasează calculul și respectiv însumarea

2. Să decuplăm foile. Calculele ulterioare se vor efectua în același mod pentru o dependență liniară de Foaia 1 și pentru o dependență pătratică de Foaia 2.

3. Sub tabelul rezultat, formați o matrice de coeficienți și un vector coloană de membri liberi. Să rezolvăm sistemul de ecuații liniare conform următorului algoritm:

Pentru a calcula matricea inversă și înmulțirea matricei, folosim De către maestru funcții si functii MOBRși MOMNOZH.

4. Într-un bloc de celule H2: H 9 pe baza coeficienților obținuți, calculăm valoarea aproximării polinomy eu deducere., în blocul I 2: I 9 - abateri D y i = y eu exp. - y eu deducere., coloana J - rezidual:

Tabelele rezultate și construite cu Chart Wizards graficele sunt prezentate în figurile 6, 7, 8.


Orez. 6. Tabel pentru calcularea coeficienților unei funcții liniare,

aproximând date experimentale.


Orez. 7. Tabel pentru calcularea coeficienților unei funcții pătratice,

aproximânddate experimentale.


Orez. 8. Prezentarea grafică a rezultatelor aproximării

date experimentale prin funcții liniare și pătratice.

Răspuns. Datele experimentale au fost aproximate prin dependența liniară y = 0,07881 X + 0,442262 cu rezidual Q = 0,165167 și dependență pătratică y = 3,115476 X 2 – 5,2175 X + 2,529631 cu rezidual Q = 0,002103 .

Sarcini. Aproximați o funcție dată de o funcție tabelară, liniară și pătratică.

Tabelul 6

№0

X

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

y

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

Să aproximăm funcția cu un polinom de gradul 2. Pentru a face acest lucru, calculăm coeficienții sistemului normal de ecuații:

, ,

Să compunem un sistem normal de cele mai mici pătrate, care are forma:

Soluția de sistem este ușor de găsit :,,.

Astfel, se găsește polinomul de gradul II:.

Context teoretic

Înapoi la pagină<Введение в вычислительную математику. Примеры>

Exemplul 2... Aflarea gradului optim al unui polinom.

Înapoi la pagină<Введение в вычислительную математику. Примеры>

Exemplul 3... Derivarea sistemului normal de ecuații pentru aflarea parametrilor dependenței empirice.

Să derivăm un sistem de ecuații pentru determinarea coeficienților și a funcției , care realizează aproximarea rădăcină pătrată medie a funcției date prin puncte. Să compunem funcția și notează condiția extremum necesară pentru aceasta:

Atunci sistemul normal va lua forma:

A primit un sistem liniar de ecuații în raport cu parametrii necunoscuți și, care este ușor de rezolvat.

Context teoretic

Înapoi la pagină<Введение в вычислительную математику. Примеры>

Exemplu.

Date experimentale despre valorile variabilelor Xși la sunt date în tabel.

Ca urmare a alinierii lor, se obține funcția

Folosind metoda celor mai mici pătrate, aproximați aceste date cu o dependență liniară y = ax + b(găsiți parametri Ași b). Aflați care dintre cele două linii este mai bună (în sensul metodei celor mai mici pătrate) egalizează datele experimentale. Faceți un desen.

Esența metodei celor mai mici pătrate (OLS).

Sarcina este de a găsi coeficienții dependenței liniare pentru care funcția a două variabile Ași bia cea mai mică valoare. Adică dat Ași b suma pătratelor abaterilor datelor experimentale de la dreapta găsită va fi cea mai mică. Acesta este punctul întreg al metodei celor mai mici pătrate.

Astfel, soluția exemplului se reduce la găsirea extremului unei funcții a două variabile.

Derivarea formulelor pentru găsirea coeficienților.

Se compune și se rezolvă un sistem de două ecuații cu două necunoscute. Aflați derivatele parțiale ale funcției prin variabile Ași b, echivalăm aceste derivate cu zero.

Rezolvăm sistemul de ecuații rezultat prin orice metodă (de exemplu metoda de substitutie sau metoda lui Cramer) și obținem formule pentru găsirea coeficienților prin metoda celor mai mici pătrate (MCO).

Cu date Ași b funcţie ia cea mai mică valoare. Dovada acestui fapt este dată mai jos în textul de la sfârșitul paginii.

Aceasta este metoda celor mai mici pătrate. Formula pentru găsirea parametrului A conţine sumele,,, şi parametrul n- cantitatea de date experimentale. Vă recomandăm să calculați separat valorile acestor sume.

Coeficient b este după calcul A.

Este timpul să ne amintim de exemplul original.

Soluţie.

În exemplul nostru n = 5... Completam tabelul pentru comoditatea calculării sumelor care sunt incluse în formulele coeficienților doriti.

Valorile din al patrulea rând al tabelului se obțin prin înmulțirea valorilor celui de-al 2-lea rând cu valorile celui de-al 3-lea rând pentru fiecare număr i.

Valorile din al cincilea rând al tabelului se obțin prin pătrarea valorilor din al doilea rând pentru fiecare număr i.

Valorile din ultima coloană a tabelului sunt sumele de rând ale valorilor.

Folosim formulele metodei celor mai mici pătrate pentru a găsi coeficienții Ași b... Înlocuim în ele valorile corespunzătoare din ultima coloană a tabelului:

Prin urmare, y = 0,165x + 2,184- linia dreaptă de aproximare necesară.

Rămâne să aflăm care dintre rânduri y = 0,165x + 2,184 sau aproximează mai bine datele originale, adică faceți o estimare folosind metoda celor mai mici pătrate.

Estimarea erorii metodei celor mai mici pătrate.

Pentru a face acest lucru, trebuie să calculați suma pătratelor abaterilor datelor inițiale de la aceste linii și , valoarea mai mică corespunde liniei care aproximează mai bine datele originale în sensul metodei celor mai mici pătrate.

De când, apoi drept y = 0,165x + 2,184 aproximează mai bine datele originale.

Ilustrare grafică a metodei celor mai mici pătrate (mns).

Totul este perfect vizibil pe grafice. Linia roșie este linia dreaptă găsită y = 0,165x + 2,184, linia albastră este , punctele roz sunt date brute.

Pentru ce este, pentru ce sunt toate aceste aproximări?

Eu personal folosesc pentru rezolvarea problemelor de netezire a datelor, probleme de interpolare și extrapolare (în exemplul original, este posibil să fi solicitat să găsiți valoarea valorii observate y la x = 3 sau la x = 6 prin metoda OLS). Dar despre asta vom vorbi mai detaliat mai târziu într-o altă secțiune a site-ului.

Înapoi la începutul paginii

Dovada.

Așa că atunci când este găsit Ași b funcția ia cea mai mică valoare, este necesar ca în acest moment matricea formei pătratice a diferenţialului de ordinul doi pentru funcţie a fost în mod pozitiv definitivă. Să o arătăm.

Diferenţialul de ordinul doi are forma:

Acesta este

Prin urmare, matricea formei pătratice are forma

iar valorile elementelor nu depind de Ași b.

Să arătăm că matricea este definită pozitivă. Acest lucru necesită ca minorii de colț să fie pozitivi.

Colț minor de ordinul întâi ... Inegalitatea este strictă, deoarece punctele nu coincid. În cele ce urmează, vom spune serios.

Colț minor de ordinul doi

Să demonstrăm asta prin metoda inducţiei matematice.

Concluzie: valori găsite Ași b corespund celei mai mici valori ale funcției , prin urmare, sunt parametrii necesari pentru metoda celor mai mici pătrate.

Nu ai timp să-ți dai seama?
Comanda o solutie

Înapoi la începutul paginii

Elaborarea unei prognoze folosind metoda celor mai mici pătrate. Un exemplu de rezolvare a problemei

Extrapolarea Este metoda cercetare științifică, care se bazează pe diseminarea tendințelor, modelelor, conexiunilor trecute și prezente pentru dezvoltarea viitoare a obiectului de prognoză. Metodele de extrapolare includ metoda mediei mobile, metoda netezirii exponențiale, metoda celor mai mici pătrate.

Esenta metoda celor mai mici pătrate consta in minimizarea sumei abaterilor standard dintre valorile observate si cele calculate. Valorile calculate se găsesc în funcție de ecuația ajustată - ecuația de regresie. Cu cât distanța dintre valorile reale și valorile calculate este mai mică, cu atât prognoza este mai precisă pe baza ecuației de regresie.

O analiză teoretică a esenței fenomenului studiat, a cărui modificare este afișată printr-o serie temporală, servește drept bază pentru alegerea unei curbe. Uneori sunt luate în considerare considerațiile despre natura creșterii nivelurilor seriei. Deci, dacă se așteaptă o creștere a producției în progresie aritmetică, apoi netezirea se efectuează de-a lungul unei linii drepte. Dacă se dovedește că creșterea este în progresie geometrică, atunci netezirea trebuie efectuată în funcție de funcția exponențială.

Formula de lucru pentru cele mai mici pătrate : Y t + 1 = a * X + b, unde t + 1 este perioada de prognoză; Уt + 1 - indicator prezis; a și b - coeficienți; X este un simbol al timpului.

Calculul coeficienților a și b se efectuează după următoarele formule:

unde, Uf - valorile reale ale unui număr de dinamici; n este numărul de niveluri din seria temporală;

Netezirea seriilor de timp prin metoda celor mai mici pătrate servește la reflectarea tiparelor de dezvoltare a fenomenului studiat. În exprimarea analitică a tendinței, timpul este considerat ca o variabilă independentă, iar nivelurile seriei acționează în funcție de această variabilă independentă.

Dezvoltarea unui fenomen nu depinde de câți ani au trecut de la momentul de început, ci de ce factori au influențat dezvoltarea lui, în ce direcție și cu ce intensitate. Prin urmare, este clar că dezvoltarea unui fenomen în timp apare ca urmare a acțiunii acestor factori.

Stabilirea corectă a tipului de curbă, tipul de dependență analitică de timp este una dintre cele mai dificile sarcini ale analizei pre-predictive. .

Selectarea tipului de funcție care descrie tendința, ai cărui parametri sunt determinați prin metoda celor mai mici pătrate, se realizează în cele mai multe cazuri empiric, prin construirea unui număr de funcții și compararea lor între ele prin valoarea pătratului mediu. eroare calculată prin formula:

unde Uf - valorile reale ale unui număr de dinamici; Ur - valori calculate (netezite) ale unui număr de dinamici; n este numărul de niveluri din seria temporală; p este numărul de parametri definiți în formulele care descriu tendința (tendința de dezvoltare).

Dezavantajele metodei celor mai mici pătrate :

  • când se încearcă descrierea fenomenului economic studiat folosind o ecuație matematică, prognoza va fi precisă pentru o perioadă scurtă de timp și ecuația de regresie ar trebui recalculată pe măsură ce devin disponibile noi informații;
  • complexitatea selecției ecuației de regresie, care este rezolvabilă atunci când se utilizează programe de calculator tipice.

Un exemplu de utilizare a metodei celor mai mici pătrate pentru a dezvolta o prognoză

Sarcină ... Există date care caracterizează rata șomajului în regiune,%

  • Construiți o prognoză a ratei șomajului în regiune pentru lunile noiembrie, decembrie, ianuarie folosind următoarele metode: medie mobilă, netezire exponențială, cele mai mici pătrate.
  • Calculați erorile predicțiilor obținute folosind fiecare metodă.
  • Comparați rezultatele obținute, trageți concluzii.

Soluția celor mai mici pătrate

Pentru rezolvare, vom compune un tabel în care vom produce calculele necesare:

ε = 28,63 / 10 = 2,86% exactitatea prognozeiînalt.

Concluzie : Compararea rezultatelor obţinute în calcule metoda mediei mobile , netezire exponenţială iar prin metoda celor mai mici pătrate, putem spune că eroarea relativă medie în calcule prin metoda de netezire exponențială se încadrează în intervalul 20-50%. Aceasta înseamnă că acuratețea prognozei în acest caz este doar satisfăcătoare.

În primul și al treilea caz, acuratețea prognozei este mare, deoarece eroarea relativă medie este mai mică de 10%. Dar metoda mediei mobile a făcut posibilă obținerea mai multor rezultate de încredere(prognoza pentru noiembrie - 1,52%, prognoza pentru decembrie - 1,53%, prognoza pentru ianuarie - 1,49%), deoarece eroarea relativă medie la utilizarea acestei metode este cea mai mică - 1,13%.

Metoda celor mai mici pătrate

Alte articole pe acest subiect:

Lista surselor utilizate

  1. Recomandări științifice și metodologice privind diagnosticarea riscurilor sociale și prognozarea provocărilor, amenințărilor și consecințelor sociale. Universitatea Socială de Stat din Rusia. Moscova. 2010;
  2. Vladimirova L.P. Prognoza si planificarea in conditii de piata: Manual. indemnizatie. M .: Editura „Dashkov and Co”, 2001;
  3. Novikova N.V., Pozdeeva O.G. Prognoza economiei naționale: Ghid didactic. Ekaterinburg: Editura Ural. stat econom. Universitatea, 2007;
  4. Slutskin L.N. Curs de MBA privind prognoza în afaceri. M .: Alpina Business Books, 2006.

Programul OLS

Introduceți datele

Date și aproximare y = a + b x

i- numărul punctului experimental;
x i- valoarea parametrului fix la punct i;
y eu- valoarea parametrului măsurat în punct i;
ω i- greutatea măsurării într-un punct i;
y i, calc.- diferența dintre măsurată și calculată prin valoarea regresiei y la punct i;
S x i (x i)- estimarea erorilor x i la măsurare y la punct i.

Date și aproximare y = k x

i x i y eu ω i y i, calc. Δy i S x i (x i)

Faceți clic pe grafic,

Instrucțiuni pentru utilizatorul programului online MNK.

În câmpul de date, introduceți valorile `x` și` y` în același punct de testare pe fiecare linie separată. Valorile trebuie separate printr-un caracter alb (spațiu sau tab).

A treia valoare poate fi greutatea punctului `w`. Dacă greutatea punctului nu este specificată, atunci aceasta este egală cu unu. În majoritatea covârșitoare a cazurilor, ponderile punctelor experimentale sunt necunoscute sau necalculate, adică. toate datele experimentale sunt considerate a fi echivalente. Uneori, ponderile din intervalul de valori studiat nu sunt absolut echivalente și pot fi chiar calculate teoretic. De exemplu, în spectrofotometrie, greutățile pot fi calculate folosind formule simple, deși practic toată lumea neglijează acest lucru pentru a reduce costurile cu forța de muncă.

Datele pot fi lipite prin clipboard dintr-o foaie de calcul dintr-o suită de birou, cum ar fi Excel din Microsoft Office sau Calc din Open Office. Pentru a face acest lucru, în foaia de calcul, selectați intervalul de date de copiat, copiați în clipboard și lipiți datele în câmpul de date de pe această pagină.

Pentru calcularea prin metoda celor mai mici pătrate, sunt necesare cel puțin două puncte pentru a determina doi coeficienți `b` - tangenta pantei dreptei și` a` - valoarea tăiată de linia dreaptă pe `y` axă.

Pentru a estima eroarea coeficienților de regresie calculați, trebuie să setați numărul de puncte experimentale mai mult de două.

Metoda celor mai mici pătrate (OLS).

Cu cât numărul de puncte experimentale este mai mare, cu atât estimarea statistică a coeficienților este mai precisă (datorită scăderii coeficientului Student) și cu atât estimarea este mai apropiată de estimarea eșantionului general.

Obținerea valorilor la fiecare punct experimental necesită adesea forță de muncă, așa că există adesea un număr de experimente care oferă o estimare digerabilă și nu duce la costuri excesive ale forței de muncă. De regulă, numărul de puncte experimentale pentru dependența liniară a celor mai mici pătrate cu doi coeficienți se selectează în regiunea de 5-7 puncte.

Scurtă teorie a metodei celor mai mici pătrate pentru dependența liniară

Să presupunem că avem un set de date experimentale sub formă de perechi de valori [`y_i`,` x_i`], unde `i` este numărul unei măsurători experimentale de la 1 la`n`; `y_i` - valoarea valorii măsurate în punctul` i`; `x_i` - valoarea parametrului pe care îl setăm în punctul` i`.

Ca exemplu, luați în considerare funcționarea Legii lui Ohm. Schimbând tensiunea (diferența de potențial) între secțiunile circuitului electric, măsurăm cantitatea de curent care trece prin această secțiune. Fizica ne oferă dependența găsită experimental:

`I = U / R`,
unde `I` - puterea curentului; `R` - rezistenta; `U` - tensiune.

În acest caz, `y_i` este valoarea curentului măsurat, iar` x_i` este valoarea tensiunii.

Ca un alt exemplu, luați în considerare absorbția luminii de către o soluție a unei substanțe într-o soluție. Chimia ne dă formula:

`A = ε l C`,
unde `A` - densitate optica soluţie; `ε` - transmitanța substanței dizolvate; `l` - lungimea drumului când lumina trece printr-o cuvă cu o soluție; `C` - concentrația de dizolvat.

În acest caz, `y_i` avem valoarea măsurată a densității optice` A`, iar `x_i` este valoarea concentrației substanței pe care o setăm.

Vom lua în considerare cazul în care eroarea relativă în setarea `x_i` este mult mai mică decât eroarea relativă în măsurarea` y_i`. De asemenea, vom presupune că toate valorile măsurate `y_i` sunt aleatorii și distribuite normal, adică. respectă legea distribuției normale.

În cazul unei dependențe liniare a lui `y` de` x`, putem scrie o dependență teoretică:
`y = a + b x`.

Din punct de vedere geometric, coeficientul `b` denotă tangenta unghiului de înclinare al dreptei la axa`x`, iar coeficientul `a` - valoarea lui`y` în punctul de intersecție a lui. linie cu axa `y` (la` x = 0`).

Aflarea parametrilor dreptei de regresie.

În experiment, valorile măsurate ale lui `y_i` nu pot sta exact pe linia dreaptă teoretică din cauza erorilor de măsurare care sunt întotdeauna inerente în viata reala... Prin urmare, o ecuație liniară trebuie reprezentată printr-un sistem de ecuații:
`y_i = a + b x_i + ε_i` (1),
unde `ε_i` este eroarea de măsurare necunoscută a lui` y` în experimentul `i`.

Dependența (1) se mai numește regresie, adică dependența a două valori una de cealaltă cu semnificație statistică.

Sarcina restabilirii dependenței este de a găsi coeficienții `a` și` b` din punctele experimentale [`y_i`,` x_i`].

Pentru a găsi coeficienții `a` și` b`, se folosește de obicei metoda celor mai mici pătrate(OLS). Este un caz special al principiului maximului probabilitate.

Să rescriem (1) ca `ε_i = y_i - a - b x_i`.

Apoi suma pătratelor erorilor va fi
`Φ = sum_ (i = 1) ^ (n) ε_i ^ 2 = sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2`. (2)

Principiul MOL (metoda celor mai mici pătrate) este de a minimiza suma (2) în raport cu parametrii `a` și` b`.

Minimul este atins atunci când derivatele parțiale ale sumei (2) față de coeficienții `a` și`b` sunt egale cu zero:
`frac (partial Φ) (partial a) = frac (partial sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (partial a) = 0`
`frac (parțial Φ) (parțial b) = frac (parțial sum_ (i = 1) ^ (n) (y_i - a - b x_i) ^ 2) (parțial b) = 0`

Extinderea derivatelor, obținem un sistem de două ecuații cu două necunoscute:
`sum_ (i = 1) ^ (n) (2a + 2bx_i - 2y_i) = sum_ (i = 1) ^ (n) (a + bx_i - y_i) = 0`
`sum_ (i = 1) ^ (n) (2bx_i ^ 2 + 2ax_i - 2x_iy_i) = sum_ (i = 1) ^ (n) (bx_i ^ 2 + ax_i - x_iy_i) = 0`

Deschidem parantezele si transferam sumele independente de coeficientii cautati in cealalta jumatate, obtinem un sistem de ecuatii liniare:
`sum_ (i = 1) ^ (n) y_i = a n + b sum_ (i = 1) ^ (n) bx_i`
`sum_ (i = 1) ^ (n) x_iy_i = a sum_ (i = 1) ^ (n) x_i + b sum_ (i = 1) ^ (n) x_i ^ 2`

Rezolvând sistemul rezultat, găsim formulele pentru coeficienții `a` și` b`:

`a = frac (sum_ (i = 1) ^ (n) y_i sum_ (i = 1) ^ (n) x_i ^ 2 - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n ) x_iy_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.1)

`b = frac (n sum_ (i = 1) ^ (n) x_iy_i - sum_ (i = 1) ^ (n) x_i sum_ (i = 1) ^ (n) y_i) (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) `(3.2)

Aceste formule au soluții când `n> 1` (linia poate fi trasă folosind cel puțin 2 puncte) și când determinantul` D = n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ) ^ (n) x_i) ^ 2! = 0`, adică când punctele `x_i` din experiment sunt diferite (adică când linia nu este verticală).

Estimarea erorilor coeficienților dreptei de regresie

Pentru o estimare mai precisă a erorii în calcularea coeficienților `a` și` b`, este de dorit un numar mare de puncte experimentale. Când `n = 2`, este imposibil să se estimeze eroarea coeficienților, deoarece linia de aproximare va trece prin două puncte fără ambiguitate.

Se determină eroarea variabilei aleatoare `V` legea cumulării erorilor
`S_V ^ 2 = sum_ (i = 1) ^ p (frac (parțial f) (parțial z_i)) ^ 2 S_ (z_i) ^ 2`,
unde `p` este numărul de parametri` z_i` cu o eroare `S_ (z_i)` care afectează eroarea `S_V`;
`f` - funcție de dependență a lui` V` de `z_i`.

Să notăm legea cumulării erorilor pentru eroarea coeficienților `a` și`b`
`S_a ^ 2 = sum_ (i = 1) ^ (n) (frac (parțial a) (parțial y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i = 1) ^ (n) (frac (parțial a) ) (parțial x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 sum_ (i = 1) ^ (n) (frac (parțial a) (parțial y_i)) ^ 2 `,
`S_b ^ 2 = sum_ (i = 1) ^ (n) (frac (parțial b) (parțial y_i)) ^ 2 S_ (y_i) ^ 2 + sum_ (i = 1) ^ (n) (frac (parțial b) ) (parțial x_i)) ^ 2 S_ (x_i) ^ 2 = S_y ^ 2 sum_ (i = 1) ^ (n) (frac (parțial b) (parțial y_i)) ^ 2 `,
de cand `S_ (x_i) ^ 2 = 0` (am făcut o rezervare mai devreme că eroarea lui` x` este neglijabilă).

`S_y ^ 2 = S_ (y_i) ^ 2` - eroare (varianță, pătratul abaterii standard) în măsurare` y`, presupunând că eroarea este uniformă pentru toate valorile lui `y`.

Înlocuind formulele de calcul `a` și` b` în expresiile obținute, obținem

`S_a ^ 2 = S_y ^ 2 frac (sum_ (i = 1) ^ (n) (sum_ (i = 1) ^ (n) x_i ^ 2 - x_i sum_ (i = 1) ^ (n) x_i) ^ 2 ) (D ^ 2) = S_y ^ 2 frac ((n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2) sum_ (i = 1) ^ (n) x_i ^ 2) (D ^ 2) = S_y ^ 2 frac (sum_ (i = 1) ^ (n) x_i ^ 2) (D) `(4.1)

`S_b ^ 2 = S_y ^ 2 frac (sum_ (i = 1) ^ (n) (n x_i - sum_ (i = 1) ^ (n) x_i) ^ 2) (D ^ 2) = S_y ^ 2 frac ( n (n sum_ (i = 1) ^ (n) x_i ^ 2 - (sum_ (i = 1) ^ (n) x_i) ^ 2)) (D ^ 2) = S_y ^ 2 frac (n) (D) „(4.2)

În majoritatea experimentelor din viața reală, valoarea „Sy” nu este măsurată. Pentru a face acest lucru, este necesar să se efectueze mai multe măsurători (experimente) paralele la unul sau mai multe puncte ale planului, ceea ce crește timpul (și, eventual, costul) experimentului. Prin urmare, de obicei se presupune că abaterea lui `y` de la linia de regresie poate fi considerată aleatorie. Estimarea varianței `y` în acest caz este calculată prin formula.

`S_y ^ 2 = S_ (y, rest) ^ 2 = frac (sum_ (i = 1) ^ n (y_i - a - b x_i) ^ 2) (n-2)`.

Divizorul `n-2` apare deoarece am scăzut numărul de grade de libertate datorită calculului a doi coeficienți pentru același eșantion de date experimentale.

Această estimare se mai numește și varianța reziduală relativă la dreapta de regresie `S_ (y, rest) ^ 2`.

Evaluarea semnificației coeficienților se realizează după criteriul Studentului

`t_a = frac (| a |) (S_a)`, `t_b = frac (| b |) (S_b)`

Dacă criteriile calculate `t_a`,` t_b` sunt mai mici decât criteriile tabulare `t (P, n-2)`, atunci se consideră că coeficientul corespunzător nu diferă semnificativ de zero cu o probabilitate dată `P`.

Pentru a evalua calitatea descrierii unei relații liniare, puteți compara `S_ (y, rest) ^ 2` și` S_ (bar y) `relativ cu medie folosind testul Fisher.

`S_ (bar y) = frac (sum_ (i = 1) ^ n (y_i - bar y) ^ 2) (n-1) = frac (sum_ (i = 1) ^ n (y_i - (sum_ (i = 1) ^ n y_i) / n) ^ 2) (n-1) `- estimarea eșantionului a varianței` y` relativ la medie.

Pentru a evalua eficacitatea ecuației de regresie pentru descrierea dependenței, se calculează coeficientul Fisher
`F = S_ (bara y) / S_ (y, rest) ^ 2`,
care se compară cu coeficientul lui Fisher din tabelul `F (p, n-1, n-2)`.

Dacă `F> F (P, n-1, n-2)`, diferența dintre descrierea dependenței `y = f (x)` folosind ecuația de regresie și descrierea folosind media este considerată semnificativă statistic cu probabilitatea `P`. Acestea. regresia descrie relația mai bine decât împrăștierea lui `y` față de medie.

Faceți clic pe grafic,
pentru a adăuga valori la tabel

Metoda celor mai mici pătrate. Metoda celor mai mici pătrate este înțeleasă ca determinarea parametrilor necunoscuți a, b, c, a dependenței funcționale adoptate.

Metoda celor mai mici pătrate este înțeleasă ca determinarea unor parametri necunoscuți a, b, c,... dependenta functionala acceptata

y = f (x, a, b, c, ...),

care ar furniza eroarea pătratică medie minimă (varianță).

, (24)

unde x i, y i - o mulțime de perechi de numere obținute în urma experimentului.

Deoarece condiția pentru extremul unei funcții a mai multor variabile este condiția egalității la zero a derivatelor sale parțiale, parametrii a, b, c,... sunt determinate din sistemul de ecuații:

; ; ; … (25)

Trebuie reținut că metoda celor mai mici pătrate este folosită pentru a selecta parametrii după tipul funcției y = f (x) definit.

Dacă din considerente teoretice este imposibil să tragem concluzii despre care ar trebui să fie formula empirică, atunci trebuie să ne ghidăm după reprezentări vizuale, în primul rând o reprezentare grafică a datelor observate.

În practică, acestea sunt cel mai adesea limitate la următoarele tipuri de funcții:

1) liniară ;

2) pătratică a.

Metoda celor mai mici pătrate

În lecția finală a subiectului, ne vom familiariza cu cea mai cunoscută aplicație FNP, care găsește cea mai largă aplicație în diverse domenii ale științei și practicii. Poate fi fizică, chimie, biologie, economie, sociologie, psihologie și așa mai departe, și așa mai departe. Prin voința destinului, de multe ori trebuie să mă ocup de economie și, prin urmare, astăzi vă voi elibera un bilet către tara uimitoare intitulat Econometrie=) ... Cum nu vrei?! Este foarte bine acolo - trebuie doar să vă hotărâți! ... Dar ceea ce probabil îți dorești cu siguranță este să înveți cum să rezolvi problemele metoda celor mai mici pătrate... Și mai ales cititorii sârguincioși vor învăța cum să le rezolve nu numai fără greșeală, ci și FOARTE RAPID ;-) Dar mai întâi formularea problemei generale+ exemplu înrudit:

Să fie investigați în anumite domenii indicatorii care au o expresie cantitativă. În același timp, există toate motivele să credem că indicatorul depinde de indicator. Această ipoteză poate fi atât o ipoteză științifică, cât și bazată pe bun simț elementar. Lăsând știința deoparte, totuși și explorând zone mai delicioase - și anume magazinele alimentare. Să notăm prin:

- spatiu comercial al unui magazin alimentar, mp,
- cifra de afaceri anuala a magazinului alimentar, mln. Rub.

Este absolut clar că, cu cât suprafața magazinului este mai mare, cu atât cifra de afaceri va fi mai mare în majoritatea cazurilor.

Să presupunem că după observarea / experimentarea / calculul / dansul cu o tamburină, avem date numerice la dispoziție:

Cu magazinele alimentare, cred că totul este clar: - aceasta este zona primului magazin, - cifra de afaceri anuală a acestuia, - zona celui de-al doilea magazin, - cifra de afaceri anuală etc. Apropo, nu este deloc necesar să aveți acces la materiale clasificate - o estimare destul de exactă a cifrei de afaceri poate fi obținută prin intermediul statistici matematice... Totuși, să nu ne lăsăm distrași, cursul spionajului comercial - este deja plătit =)

Datele tabelare pot fi scrise și sub formă de puncte și descrise în mod obișnuit pentru noi Sistemul cartezian .

Vom răspunde la întrebare importantă: de câte puncte ai nevoie pentru un studiu calitativ?

Cu cât mai mare cu atât mai bine. Setul minim admis este format din 5-6 puncte. În plus, cu o cantitate mică de date, eșantionul nu poate include rezultate „anomale”. Deci, de exemplu, un mic magazin de elită îi poate ajuta cu ordine de mărime mai mulți „colegii săi”, distorsionând astfel modelul general care trebuie găsit!



Pentru a spune simplu - trebuie să alegem o funcție, programa care trece cât mai aproape de puncte ... Această funcție este numită aproximând (aproximare - aproximare) sau functie teoretica ... În general, apare imediat un „provocator” evident - un polinom de grad înalt al cărui grafic trece prin TOATE punctele. Dar această opțiune este dificilă și adesea pur și simplu incorectă. (deoarece graficul se va „răuci” tot timpul și reflectă slab tendința principală).

Astfel, funcția căutată ar trebui să fie suficient de simplă și, în același timp, să reflecte adecvat dependența. După cum ați putea ghici, una dintre metodele pentru găsirea unor astfel de funcții este numită metoda celor mai mici pătrate... Mai întâi, să-i analizăm esența în vedere generala... Fie ca o funcție să aproximeze datele experimentale:


Cum se evaluează acuratețea acestei aproximări? Să calculăm diferențele (abaterile) dintre experimentul și valorile functionale (studind desenul)... Primul gând care îmi vine în minte este de a estima cât de mare este suma, dar problema este că diferențele pot fi negative. (De exemplu, ) iar abaterile ca urmare a unei astfel de însumări se vor anula reciproc. Prin urmare, ca o estimare a preciziei aproximării, se cere să se accepte suma module abateri:

sau prăbușit: (deodată, cine nu știe: Este pictograma suma și - variabilă auxiliară - „contor”, care ia valori de la 1 la ) .

Abordând punctele experimentale cu diferite funcții, vom obține valori diferite și este evident unde această sumă este mai mică - acea funcție este mai precisă.

O astfel de metodă există și se numește metoda modulului minim... Cu toate acestea, în practică, a devenit mult mai răspândită. metoda celor mai mici pătrate, în care posibilele valori negative sunt eliminate nu prin modul, ci prin pătrarea abaterilor:



, după care eforturile sunt direcționate către selectarea unei astfel de funcție astfel încât suma pătratelor abaterilor era cât se poate de mică. De fapt, de aici și numele metodei.

Și acum ne întoarcem la altul punct important: după cum sa menționat mai sus, funcția selectată ar trebui să fie destul de simplă - dar există și multe astfel de funcții: liniar , hiperbolic , exponenţială , logaritmică , pătratică etc. Și, bineînțeles, aici aș vrea imediat să „reduiesc domeniul de activitate”. Ce clasă de funcții să alegeți pentru cercetare? Primitiv dar recepție eficientă:

- Cel mai simplu mod de a atrage puncte pe desen și analizați locația acestora. Dacă tind să fie în linie dreaptă, atunci ar trebui să cauți ecuația unei linii drepte cu valori optime și. Cu alte cuvinte, sarcina este de a găsi ACEPTĂ coeficienți - astfel încât suma pătratelor abaterilor să fie cea mai mică.

Dacă punctele sunt situate, de exemplu, de-a lungul hiperbolă, atunci este clar a priori că o funcție liniară va da o aproximare proastă. În acest caz, căutăm cei mai „favorabili” coeficienți pentru ecuația hiperbolei - cele care dau suma minima de patrate .

Acum rețineți că în ambele cazuri vorbim funcţiile a două variabile ale căror argumente sunt parametrii dependențelor dorite:

Și, în esență, trebuie să rezolvăm o problemă standard - să găsim funcţie minimă a două variabile.

Să ne amintim exemplul nostru: să presupunem că punctele „magazin” tind să fie situate în linie dreaptă și există toate motivele să credem că relație liniară cifra de afaceri din spatiul comercial. Să găsim astfel de coeficienți „a” și „bs” astfel încât suma pătratelor abaterilor era cel mai mic. Totul este ca de obicei - mai întâi Derivate parțiale de ordinul I... Conform regula liniarității puteți diferenția direct sub pictograma sumă:

Dacă doriți să folosiți aceste informații pentru un eseu sau carte de curs, vă voi fi foarte recunoscător pentru linkul din lista de surse, veți găsi astfel de calcule detaliate în câteva locuri:

Să compunem un sistem standard:

Reducem fiecare ecuație cu „două” și, în plus, „despărțim” sumele:

Notă : Analizați singur de ce „a” și „bie” pot fi eliminate pentru pictograma sumă. Apropo, formal acest lucru se poate face cu suma

Să rescriem sistemul într-o formă „aplicată”:

după care începe să fie trasat algoritmul pentru rezolvarea problemei noastre:

Cunoaștem coordonatele punctelor? Noi stim. Sume putem gasi? Uşor. Compunem cel mai simplu sistem de două ecuații liniare în două necunoscute("A" și "bh"). Rezolvăm sistemul, de exemplu, metoda lui Cramer, în urma căruia obținem un punct staționar. Control condiție suficientă pentru extremum, se poate asigura că în acest moment funcția realizează exact minim... Verificarea este asociată cu calcule suplimentare și, prin urmare, o vom lăsa în culise. (dacă este necesar, cadrul lipsă poate fi vizualizatAici ) ... Tragem concluzia finală:

Funcţie cel mai bun mod (cel puțin în comparație cu orice altă funcție liniară) apropie punctele experimentale ... În linii mari, graficul său se află cât mai aproape de aceste puncte. In traditie econometrie funcţia de aproximare rezultată se mai numeşte ecuația de regresie liniară pereche .

Problema luată în considerare are o mare amploare semnificație practică... În situația cu exemplul nostru, ecuația vă permite să preziceți ce cifră de afaceri ("Joc") va fi la magazinul cu una sau alta valoare a spațiului comercial (aceasta sau acea valoare „x”)... Da, prognoza obținută va fi doar o prognoză, dar în multe cazuri va fi destul de precisă.

Voi analiza doar o problemă cu numerele „reale”, deoarece nu există dificultăți în ea - toate calculele sunt la nivelul curriculum-ului școlii de clase 7-8. În 95 la sută din cazuri, vi se va cere să găsiți doar o funcție liniară, dar la sfârșitul articolului voi arăta că nu este mai dificil să găsiți ecuațiile hiperbolei optime, ale exponentului și ale altor funcții.

De fapt, rămâne să împărțiți chiflele promise - astfel încât să învățați cum să rezolvați astfel de exemple nu numai cu acuratețe, ci și rapid. Studiem cu atenție standardul:

Sarcină

În urma studierii relației dintre cei doi indicatori s-au obținut următoarele perechi de numere:

Folosind metoda celor mai mici pătrate, găsiți funcția liniară care aproximează cel mai bine empiric (cu experienta) date. Realizați un desen pe care, într-un sistem de coordonate dreptunghiular cartezian, să trasați punctele experimentale și un grafic al funcției de aproximare ... Aflați suma pătratelor abaterilor dintre valorile empirice și teoretice. Aflați dacă funcția ar fi mai bună (din punct de vedere al metodei celor mai mici pătrate) măriți punctele experimentale.

Rețineți că semnificațiile „x” sunt naturale, iar aceasta are un sens caracteristic caracteristic, despre care voi vorbi puțin mai târziu; dar ele, desigur, pot fi fracționate. În plus, în funcție de conținutul unei anumite probleme, atât valorile „x” cât și „joc” pot fi complet sau parțial negative. Ei bine, avem o sarcină „fără chip” și o începem soluţie:

Găsim coeficienții funcției optime ca soluție a sistemului:

De dragul unei notații mai compacte, variabila „contor” poate fi omisă, deoarece este deja clar că însumarea se realizează de la 1 la.

Este mai convenabil să calculați sumele necesare într-o formă tabelară:


Calculele pot fi efectuate pe un microcalculator, dar este mult mai bine să utilizați Excel - atât mai rapid, cât și fără erori; vezi un scurt video:

Astfel, obținem următoarele sistemul:

Aici puteți înmulți a doua ecuație cu 3 și scădeți a 2-a din prima ecuație termen cu termen... Dar acesta este noroc - în practică, sistemele nu sunt adesea un cadou și, în astfel de cazuri, economisesc metoda lui Cramer:
, ceea ce înseamnă că sistemul are o soluție unică.

Sa verificam. Înțeleg că nu vreau, dar de ce să omit erorile unde pot fi evitate complet? Înlocuim soluția găsită în partea stângă a fiecărei ecuații a sistemului:

Se obțin părțile din dreapta ecuațiilor corespunzătoare, ceea ce înseamnă că sistemul este rezolvat corect.

Astfel, funcţia de aproximare necesară: - de la a tuturor funcţiilor liniare ea este cea care aproximează datele experimentale în cel mai bun mod.

Spre deosebire de Drept dependenţa cifrei de afaceri a magazinului de suprafaţa acestuia, dependenţa constatată este verso (principiul „cu cât mai mult - cu atât mai puțin”), iar acest fapt este imediat relevat de negativ pantă... Funcţie ne informează că odată cu creșterea unui anumit indicator cu 1 unitate, valoarea indicatorului dependent scade in medie cu 0,65 unități. După cum se spune, cu cât prețul hrișcii este mai mare, cu atât se vinde mai puțin.

Pentru a reprezenta graficul funcției de aproximare, găsim două dintre valorile acesteia:

și executați desenul:

Linia construită se numește linie de tendință (și anume, o linie de tendință liniară, adică, în cazul general, o tendință nu este neapărat o linie dreaptă)... Toată lumea este familiarizată cu expresia „fii în tendințe”, și cred că acest termen nu are nevoie de comentarii suplimentare.

Să calculăm suma pătratelor abaterilor între valorile empirice şi cele teoretice. Din punct de vedere geometric, este suma pătratelor lungimilor segmentelor „crimson”. (dintre care două sunt atât de mici încât nici măcar nu le poți vedea).

Să rezumam calculele într-un tabel:


Se pot face din nou manual, doar în cazul în care voi da un exemplu pentru primul punct:

dar este mult mai eficient să acționezi într-un mod binecunoscut:

Să repetăm: ce semnificatie are rezultatul obtinut? Din a tuturor funcţiilor liniare funcţie indicatorul este cel mai mic, adică din familia sa este cea mai bună aproximare. Și aici, apropo, întrebarea finală a problemei nu este întâmplătoare: ce se întâmplă dacă funcția exponențială propusă va fi mai bine să aproximăm punctele experimentale?

Să găsim suma corespunzătoare a pătratelor abaterilor - pentru a distinge, le voi desemna cu litera „epsilon”. Tehnica este exact aceeași:


Și din nou, doar pentru fiecare pompier, calcule pentru primul punct:

În Excel, folosim funcția standard EXP (consultați Ajutorul Excel pentru sintaxă).

Concluzie:, ceea ce înseamnă că funcția exponențială aproximează punctele experimentale mai rău decât linia dreaptă .

Dar aici trebuie remarcat că „mai rău” este nu înseamnă încă, Ce s-a întâmplat. Acum am trasat această funcție exponențială - și se apropie, de asemenea, de puncte - atât de mult încât fără cercetări analitice este greu de spus care funcție este mai precisă.

Aceasta completează soluția și revin la întrebarea valorilor naturale ale argumentului. În diverse studii, de regulă, economice sau sociologice, „xurile” naturale numără luni, ani sau alte intervale de timp egale. Luați în considerare, de exemplu, o problemă ca aceasta:

Avem următoarele date despre cifra de afaceri cu amănuntul a magazinului pentru prima jumătate a anului:

Folosind alinierea analitică în linie dreaptă, determinați cifra de afaceri pentru iulie.

Da, nicio problemă: numerotăm lunile 1, 2, 3, 4, 5, 6 și folosim algoritmul obișnuit, în urma căruia obținem o ecuație - singurul lucru când vine vorba de timp este de obicei litera „te " (deși acest lucru nu este critic)... Ecuația rezultată arată că în prima jumătate a anului comerțul a crescut în medie cu 27,74 unități. pe luna. Obțineți prognoza pentru iulie (luna nr. 7): d.e.

Și astfel de sarcini - întunericul este întuneric. Cei care doresc pot folosi un serviciu suplimentar si anume my Calculator Excel (versiunea demo), care rezolvă problema analizată aproape instantaneu! Versiunea de lucru a programului este disponibilă în schimb sau pentru jeton.

La sfârșitul lecției, informații scurte despre găsirea dependențelor de alte tipuri. De fapt, nu este nimic special de spus, deoarece abordarea principială și algoritmul de soluție rămân aceleași.

Să presupunem că aranjarea punctelor experimentale seamănă cu o hiperbolă. Apoi, pentru a găsi coeficienții celei mai bune hiperbole, trebuie să găsiți minimul funcției - cei care doresc pot efectua calcule detaliate și pot ajunge la un sistem similar:

Din punct de vedere formal și tehnic, se obține dintr-un sistem „liniar”. (să-l desemnăm cu un „asterisc”)înlocuind „x” cu. Ei bine, iar sumele sunt calculați, apoi la coeficienții optimi „a” și „fi” la o aruncătură de piatră.

Dacă există toate motivele să credem că punctele sunt situate de-a lungul unei curbe logaritmice, apoi pentru a căuta valori optime și pentru a găsi minimul funcției ... Formal, în sistem (*) trebuie înlocuit cu:

Când faceți calcule în Excel, utilizați funcția LN... Recunosc, nu îmi va fi greu să creez calculatoare pentru fiecare dintre cazurile luate în considerare, dar tot va fi mai bine dacă „programezi” singur calculele. Videoclipuri de lecție pentru a ajuta.

Cu dependența exponențială, situația este puțin mai complicată. Pentru a reduce problema la cazul liniar, să logaritmăm funcția și utilizarea proprietățile logaritmului:

Acum, comparând funcția rezultată cu o funcție liniară, ajungem la concluzia că în sistem (*) trebuie înlocuit cu, și - prin. Pentru comoditate notăm:

Vă rugăm să rețineți că sistemul este rezolvat relativ la și și, prin urmare, după găsirea rădăcinilor, trebuie să vă amintiți să găsiți coeficientul în sine.

Pentru a apropia punctele experimentale parabola optimă , ar trebui găsit funcţie minimă a trei variabile ... După finalizarea acțiunilor standard, obținem următoarea „funcționare” sistemul:

Da, desigur, aici sunt mai multe sume, dar atunci când utilizați aplicația preferată, nu există deloc dificultăți. Și, în sfârșit, vă voi spune cum să verificați și să construiți rapid linia de tendință dorită folosind Excel: creați o diagramă de dispersie, selectați oricare dintre punctele cu mouse-ul și prin clic dreapta selectați opțiunea „Adăugați o linie de tendință”... Apoi, selectați tipul de diagramă și pe filă "Parametrii" activați opțiunea Afișați ecuația în diagramă... O.K

Ca întotdeauna, aș vrea să închei articolul cu o frază frumoasă și aproape că am tastat „Fii în tendințe!”. Dar s-a răzgândit în timp. Și nu pentru că este stereotip. Nu știu cum cineva, dar nu vreau să urmăresc tendința promovată americană și mai ales europeană =) Prin urmare, vă doresc fiecăruia dintre voi să adere la propria linie!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metoda celor mai mici pătrate este una dintre cele mai răspândite și mai dezvoltate datorită ei simplitatea și eficiența metodelor de estimare a parametrilor modelelor econometrice liniare... În același timp, trebuie avută o anumită prudență atunci când îl utilizați, deoarece modelele construite odată cu utilizarea sa pot să nu satisfacă o serie de cerințe pentru calitatea parametrilor lor și, ca urmare, nu este „destul de bun” pentru a afișa modele de dezvoltare a procesului.

Să luăm în considerare mai detaliat procedura de estimare a parametrilor unui model econometric liniar folosind metoda celor mai mici pătrate. Un astfel de model în formă generală poate fi reprezentat prin ecuația (1.2):

y t = a 0 + a 1 х 1t + ... + a n х nt + ε t.

Datele inițiale la estimarea parametrilor a 0, a 1, ..., a n este vectorul valorilor variabilei dependente y= (y 1, y 2, ..., y T) „și matricea valorilor variabilelor independente

în care prima coloană a celor corespunde coeficientului modelului.

Metoda celor mai mici pătrate și-a primit numele, pornind de la principiul de bază, pe care estimările parametrilor obținute pe baza ei trebuie să-l satisfacă: suma pătratelor erorii de model ar trebui să fie minimă.

Exemple de rezolvare a problemelor folosind metoda celor mai mici pătrate

Exemplul 2.1.Întreprinderea comercială are o rețea de 12 magazine, informații despre activitățile cărora sunt prezentate în tabel. 2.1.

Conducerea companiei ar dori să știe în ce măsură dimensiunea cifrei de afaceri anuale depinde de spațiul de vânzare cu amănuntul al magazinului.

Tabelul 2.1

Numărul magazinului Cifra de afaceri anuală, mln RUB Suprafata comerciala, mii m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Soluția celor mai mici pătrate. Să desemnăm - cifra de afaceri anuală a celui de-al-lea magazin, milioane de ruble; - suprafața de vânzare a celui de-al-lea magazin, mii m2.

Figura 2.1. Graficul de dispersie de exemplu 2.1

Pentru a determina forma relației funcționale dintre variabile și a construi o diagramă de dispersie (Fig. 2.1).

Pe baza diagramei de dispersie, se poate concluziona că cifra de afaceri anuală este dependentă pozitiv de spațiul comercial (adică y va crește odată cu creșterea). Cea mai potrivită formă de comunicare funcțională este liniar.

Informațiile pentru calcule suplimentare sunt prezentate în tabel. 2.2. Folosind metoda celor mai mici pătrate, estimăm parametrii unui model econometric liniar cu un singur factor

Tabelul 2.2

t YT x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Media 68,29 0,89

În acest fel,

În consecință, cu o creștere a suprafeței de vânzare cu 1 mie m 2, toate celelalte lucruri fiind egale, cifra de afaceri medie anuală crește cu 67,8871 milioane de ruble.

Exemplul 2.2. Conducerea companiei a observat că cifra de afaceri anuală depinde nu doar de spațiul de vânzare cu amănuntul al magazinului (vezi exemplul 2.1), ci și de numărul mediu de vizitatori. Informațiile relevante sunt prezentate în tabel. 2.3.

Tabelul 2.3

Soluţie. Să desemnăm - numărul mediu de vizitatori ai magazinului pe zi, mii de oameni.

Pentru a determina forma relației funcționale dintre variabile și a construi o diagramă de dispersie (Fig. 2.2).

Pe baza graficului de dispersie, se poate concluziona că cifra de afaceri anuală depinde pozitiv de numărul mediu de vizitatori pe zi (adică, y va crește odată cu creșterea). Forma dependenței funcționale este liniară.

Orez. 2.2. Scatterplot pentru Exemplul 2.2

Tabelul 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
In medie 10,65

În general, este necesar să se determine parametrii modelului econometric cu doi factori

у t = a 0 + a 1 х 1t + a 2 х 2t + ε t

Informațiile necesare pentru calcule ulterioare sunt prezentate în tabel. 2.4.

Să estimăm parametrii unui model econometric liniar cu doi factori folosind metoda celor mai mici pătrate.

În acest fel,

Estimarea coeficientului = 61,6583 arată că, toate celelalte fiind egale, cu o creștere a suprafeței de vânzare cu 1 mie m 2, cifra de afaceri anuală va crește cu o medie de 61,6583 milioane de ruble.

Estimarea coeficientului = 2,2748 arată că, toate celelalte fiind egale, cu o creștere a numărului mediu de vizitatori la 1.000 de persoane. pe zi, cifra de afaceri anuală va crește cu o medie de 2,2748 milioane de ruble.

Exemplul 2.3. Folosind informațiile prezentate în tabel. 2.2 și 2.4, estimați parametrul modelului econometric univariat

unde este valoarea centrată a cifrei de afaceri anuale a celui de-al-lea magazin, milioane de ruble; - valoarea centrată a numărului mediu zilnic de vizitatori la al-lea magazin, mii de persoane. (vezi exemplele 2.1-2.2).

Soluţie. Informațiile suplimentare necesare pentru calcule sunt prezentate în tabel. 2.5.

Tabelul 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Cantitate 48,4344 431,0566

Folosind formula (2.35), obținem

În acest fel,

http://www.cleverstudents.ru/articles/mnk.html

Exemplu.

Date experimentale despre valorile variabilelor Xși la sunt date în tabel.

Ca urmare a alinierii lor, se obține funcția

Folosind metoda celor mai mici pătrate, aproximați aceste date cu o dependență liniară y = ax + b(găsiți parametri Ași b). Aflați care dintre cele două linii este mai bună (în sensul metodei celor mai mici pătrate) egalizează datele experimentale. Faceți un desen.

Soluţie.

În exemplul nostru n = 5... Completam tabelul pentru comoditatea calculării sumelor care sunt incluse în formulele coeficienților doriti.

Valorile din al patrulea rând al tabelului se obțin prin înmulțirea valorilor celui de-al 2-lea rând cu valorile celui de-al 3-lea rând pentru fiecare număr i.

Valorile din al cincilea rând al tabelului se obțin prin pătrarea valorilor din al doilea rând pentru fiecare număr i.

Valorile din ultima coloană a tabelului sunt sumele de rând ale valorilor.

Folosim formulele metodei celor mai mici pătrate pentru a găsi coeficienții Ași b... Înlocuim în ele valorile corespunzătoare din ultima coloană a tabelului:

Prin urmare, y = 0,165x + 2,184- linia dreaptă de aproximare necesară.

Rămâne să aflăm care dintre rânduri y = 0,165x + 2,184 sau aproximează mai bine datele originale, adică faceți o estimare folosind metoda celor mai mici pătrate.

Dovada.

Așa că atunci când este găsit Ași b funcția ia cea mai mică valoare, este necesar ca în acest moment matricea formei pătratice a diferenţialului de ordinul doi pentru funcţie a fost în mod pozitiv definitivă. Să o arătăm.

Diferenţialul de ordinul doi are forma:

Acesta este

Prin urmare, matricea formei pătratice are forma

iar valorile elementelor nu depind de Ași b.

Să arătăm că matricea este definită pozitivă. Acest lucru necesită ca minorii de colț să fie pozitivi.

Colț minor de ordinul întâi ... Inegalitatea este strictă, deoarece punctele

Ți-a plăcut articolul? Împărtășește-l