6 svar
32 visningar
naytte 7499 – Moderator
Postad: Idag 17:23 Redigerad: Idag 17:31

Hur ska man bäst tolka begreppet derivata?

Hej!

Derivatan är ett objekt som alla som läser någon matematik använder flitigt till den grad att det ofta sitter i ryggmärgen hur man beräknar och använder den. Emellertid kan det bli så automatiskt att man glömmer den egentliga intuitionen bakom vad objektet är. Denna situation infann jag mig i häromdagen och på vidare fundering undrar jag om de typiska tolkningarna som man hittar verkligen håller. Det är vanligt att man påstår att derivatan i en punkt

  • representerar en instantan förändring i en storhet
  • representerar en lutning i en punkt
  • representerar lutningen hos tangentlinjen till kurvan i punkten. 

Den gemensamma nämnaren bland de första två tolkningarna är att man motsägelsefullt talar om en förändring i en enda punkt, vilket åtminstone logiskt sett inte är särskilt upplysande; man behöver ju alltid minst två punkter för att kunna beräkna en förändring!

Den tredje tolkningen är mycket mer frestande men tyvärr tror jag inte att den håller. Hur definierar man begreppet tangent utan att redan veta vad derivata betyder? Jag är öppen för att den kan vara en nöjaktig tolkning men jag har som sagt aldrig sett någon allmängiltig definition av begreppet tangent som inte åberopar derivatan.


Jag har funderat lite i icke-standardtermer om vad derivatan representerar, och jag skulle vilja presentera mina tankegångar nedan och höra vad ni tycker om dem. Jag kan avslöja att slutsatsen av dessa är att derivatan inte representerar någon slags "instantan förändring", utan snarare en storhet som vi "lika gärna" kan använda istället för faktiskta förändringar. Jag ska försöka illustrera detta med exemplet nedan:

Låt säga att vi studerar en partikel som kastas upp i luften och vars höjd över marken beskrivs av funktionen ff som definieras av ft=t2\displaystyle f\left(t\right)=t^2. Vi kan välja en nollskild infinitesimal Δt\Delta t och beräkna medelhastigheten över ett infinitesimalt intervall I:=[t,t+Δt]I:=[t,t+\Delta t] som vanligt:

ft+Δt-ftΔt=ΔfΔt=2t+Δt\displaystyle \frac{f\left(t+\Delta t\right)-f\left(t\right)}{\Delta t}=\frac{\Delta f}{\Delta t}=2t+\Delta t

Denna kvot är alltså generellt en funktion av både tt och Δt\Delta t och vi kan tolka den som genomsnittsfarten hos partikeln över intervallet II. En viktig observation är att även om kvoten beror på Δt\Delta t, så är standarddelen 2t2t entydigt bestämd för varje punkt tt oavsett vilken infinitesimal Δt\Delta t vi väljer. Vi kan göra det som kallas att "ta standarddelen" av kvoten, alltså att döda alla infinitesimala komponenter och därigenom erhålla derivatan:

stΔfΔt=:f't=2t\displaystyle \mathrm{st}\frac{\Delta f}{\Delta t}=:f^\prime\left(t\right)=2t

Det mejkar ingen sense att försöka tolka detta som en medelfart längre, för en medelfart kan bara finnas mellan två punkter. Däremot kan vi tolka det som den närmsta standardapproximationen till alla medelfarter över II oavsett val av Δt\Delta t. Då är det inte en fart i sig, men vi kan ändå utföra viktiga beräkningar med den. Vad menar jag med det? Jo, låt säga att vi önskar beräkna förändringen i partikelns läge mellan tiderna t=at=a och t=bt=b. Intuitivt vill vi summera oändligt många termer på formen 2t+Δtdt\left(2t+\Delta t\right)dt, för någon infinitesimal dtdt, över [a,b][a,b], och sedan döda eventuella infinitesimala fel genom att ta standarddelen:

Δf=stab2t+Δtdt=stab2tdt+Δtabdt=\displaystyle \Delta f=\mathrm{st}\sum_{a}^{b}\left(2t+\Delta t\right)dt=\mathrm{st}\left(\sum_{a}^{b}2tdt+\Delta t\sum_{a}^{b}dt\right)=\dots

Vi summerar alltså oändligt många, infinitesimala förflyttningar genom att använda våra medelhastigheter över infinitesimala intervall på samma form som II.

Notera att termen Δtabdt\Delta t\sum_{a}^{b}dt har en infinitesimal faktor, vilket rimligtvis gör hela termen infinitesimal så att den försvinner då vi tar standarddelen. Vi hade alltså fått samma sak som om vi istället hade räknat

Δf=stabf'tdt=stab2tdt=\displaystyle \displaystyle \Delta f=\mathrm{st}\sum_{a}^{b}f^\prime\left(t\right)dt=\mathrm{st}\sum_{a}^{b}2tdt=\dots

Om vi alltså ändå får samma sak, oavsett om vi räknar med faktiska medelfarter över infinitesimala intervall, eller bara använder derivatan, varför inte använda derivatan? Den är ju entydigt bestämd i varje punkt i definitionsmängden till ff och den är klart enklare att hantera. Det är dock INTE en fart i sig utan en approximation till alla medelfarter över infinitesimala intervall som går lika bra att använda eftersom man får samma svar ändå. 

Tolkningen ovan tror jag generaliseras ganska naturligt till mer geometriska tolkningar av derivatan, där vi vill tänka att det är någon slags lutning. Derivatan i en punkt är då det närmsta reella talet till alla lutningar mellan punkten i fråga och alla punkter som ligger oändligt nära. Den representerar INTE en lutning i sig. Om det inte spelar någon större roll för våra beräkningar huruvida vi använder denna reella approximation eller de äkta lutningarna kan vi ju lika gärna använda den reella approximationen, eftersom den är unik i varje punkt och är enklare att använda (och är reell, för den delen!).

Jag tror att tolkningarna här sammanfaller ganska väl med den typiska definition av derivata med gränsvärden.


Vad tror ni om tolkningen som presenteras ovan? Är den rimlig, orimlig? Har jag kanske helt fel i att det är paradoxalt att tala om momentana förändringshastigheter?

Jag är väldigt nyfiken till hur ni andra tänker kring detta!

Tomten 2012
Postad: Idag 17:51 Redigerad: Idag 17:52

Jag tror inte det är särskilt bra att förväxla begreppet Derivata med någon av dess tillämpningar. Alltså: se Derivata som det Gränsvärde den är strikt definierad som och befriad från alla sina tillämpningar såsom  t ex "tangentens lutning" (geometrisk tillämpning) eller "momentanhastighet" (mekanisk tillämpning). 

naytte 7499 – Moderator
Postad: Idag 17:58 Redigerad: Idag 17:58

@Tomten,

jag förstår vad du säger men någonstans är det ju trevligt med intuitionen bakom definitionerna också! Att lära sig en logisk definition kan vem som helst, men att förstå hur man kan använda den och "känna" varför den är rimlig är väldigt eftersträvansvärt i ingenjörsmässiga tillämpningar.

Gustor Online 789
Postad: Idag 18:48 Redigerad: Idag 19:06

Jag håller med Tomten om att det är viktigt att skilja matematiska definitioner från andra informella definitioner eller intuitioner. Begrepp som instantaneous rate of change eller förändringshastighet är inte rigorösa, matematiska termer. Begrepp som lutning kan vara formellt definierat, men då inte som funktion av punkter (åtminstone inte vad jag sett) utan som funktion av exempelvis par av punkter (typ Δy/Δx\Delta y / \Delta x) eller vinklar (typ tanθ\tan \theta). "Lutningen i en punkt" är därför inte heller en rigorös matematisk formulering. Personligen skulle jag bli förskräckt av att läsa "derivatan är lutningen i en punkt" i en lärobok eller annan mattebok, medan "derivatan är lutningen på tangenten" är mindre upprörande, om än en rätt underlig intuition när man tänker efter. En punkt kan ju inte luta, precis som något inte kan förändras utan ett förlopp.

Dessa intuitioner är användbara endast om det är underförstått att de beskriver hur den rigorösa matematiken idealiserar aspekter ur verkligheten. Gränsvärden är inte processer, utan abstrakta matematiska objekt. Men deras underliggande idé från början har varit att fånga gränsprocesser med formalism. På samma sätt bör man se på derivata. Derivator är matematiska objekt, precis som funktioner, punkter och polynom. Vi kan inte ta två punkter som är "oändligt nära" varandra och beräkna medellutningen i verkligheten, men i matematiken kan vi under vissa förutsättningar göra precis det (mer precist så gör vi inte alls det i matematiken, utan vi manipulerar endast abstrakta matematiska objekt som påminner om det). Vi kan då använda intuitionen att derivatan beskriver hur en ytterst liten förändring i invärden förhåller sig till motsvarande förändring i utvärden; hur känslig vår funktion är för förändringar i invärden.

Det stämmer att det är knepigt att definiera tangent utan att använda derivata då begreppen är så sammanflätade. Att säga att derivatan till en funktion är definierad som lutningen på tangenten i den punkten är väldigt sällan ett rigoröst matematiskt påstående, eftersom man inte preciserat vad man menar med tangent eller visat att det finns någon unik tangent som berättigar den bestämda formen "tangenten".

Om man med 'tangent' endast avser en linje som skär grafen till någon funktion "i en punkt" så har alla punkter oändligt många tangenter. Det görs ofta implicit ett antagande om att det finns en unik tangent i någon punkt med någon speciell egenskap som inte brukar förklaras närmare. Att en sådan unik tangent existerar är ekvivalent med att funktionen är deriverbar i punkten. Den "speciella egenskapen" är att tangenten är den bästa linjära approximationen av funktionen i ett område kring punkten.

Den tolkning som du presenterar ser så vitt jag kan se ut som hur man definierar derivata i icke-standard analys, vilket vad jag förstår går utmärkt. Jag vet inte om jag tycker den är elegantare än att använda ε\varepsilon-δ\delta, men jag är inte så insatt.

Laguna 31806
Postad: Idag 19:04

Hur de gamla grekerna definierade tangent vet jag inte, men de använde inte derivata.

Gustor Online 789
Postad: Idag 19:16
Laguna skrev:

Hur de gamla grekerna definierade tangent vet jag inte, men de använde inte derivata.

Om jag minns rätt så definierade Euklides tangenter endast för cirklar, som då var räta linjer som endast nuddade cirkeln utan att dela den i bitar, eller något sådant. Kanske inte en så rigorös definition med dagens mått mätt, men idéen framgår rätt tydligt.

naytte 7499 – Moderator
Postad: Idag 19:36 Redigerad: Idag 19:41

@Gustor, jag håller givetvis med om att man kan köra helt på matematiska definitioner befriade från intuition, men det är inte mänskligt att göra matematik på det sättet. Våra definitioner är ju abstraktioner av saker vi önskar beskriva så någonstans måste vi ju veta vad vi önskar beskriva för att kunna skapa våra definitioner. Exempelvis vill ju kunna förstå intuitivt varför en derivata som är noll motsvarar att kurvan är "platt i den punkten", vad exakt det nu ska innebära.


Det är ganska vanligt att man talar om "lutningar i en punkt" även i matematiska sammanhang, t.ex. i svaret nedan. Jag är övertygad om att jag har sett exakt denna formulering i matematikböcker, men jag kan inte erinra mig om namnet.

https://www.pluggakuten.se/trad/derivatans-definition-58/?order=all#post-8d2c3818-20ec-4802-b426-ac7d007f77d1


Det du skriver om bästa linjära approximationer är intressant. Skulle du kunna utveckla vad du menar med det? Det låter ju suspekt likt terminologin man använder då man talar om Taylorutvecklingar men där använder man ju derivatabegreppet.


Tolkningen som jag föreslår fungerar väl egentligen bara i NSA (och inte ens där har jag sett den, men jag tror att den är OK eftersom jag har sett liknande tolkninga i andra NSA-sammanhang). Finns det någon liknande tolkning som skulle fungera även i den vanliga definitionen med gränsvärden?

Svara
Close