Varför kan man tillämpa klassisk termodynamik på verkliga system?
Hej!
De senaste veckorna har jag läst en ganska mycket klassisk termodynamik och har en fundering som har stört mig ganska mycket sedan jag imorse kom att tänka på den i duschen. Inledningvis kommer jag presentera ett kort tankeexperiment för att härleda en viktig slutsats och grunden för min fråga, och sedan kommer jag diskutera själva frågan.
Studera en behållare som är indelad i två delar som båda fylls med gas. Väggen som avskiljer partitionerna från varandra är sådan att partitionerna inte kan interagera med varandra på något sätt alls och vi anordnar det så att den ena partitionen (partition 1) dessutom är helt isolerad från universum. Vi låter nu gasen i partition 1 nå jämvikt. Då gasen i partition 1 har nått jämvikt dumpar vi plötsligt termisk energi i partition 2 och avskiljer denna i samma ögonblick från universum. Exakt i detta ögonblick betraktar vi vår behållare, som är helt isolerad från omgivningen och vars partitioner är helt isolerade från varandra, som ett eget universum. Nu är alltså partition 1 i jämvikt och har således en väldefinierad entropi medan partition 2 inte befinner sig i jämvikt och därför inte har någon entropi. Uppenbarligen är det alltså möjligt för en del av universum att befinna sig i jämvikt medan en annan del av universum inte befinner sig i jämvikt, så länge det finns en lämplig begränsning som hindrar "ojämvikten" att fortplanta sig mellan delarna. Utan en sådan begränsning medför att en del inte befinner sig i jämvikt nödvändigtvis att den andra delen inte heller befinner sig i jämvikt.
Tänk nu att vi vore en kemist som ville genomföra en kemisk reaktion i ett mot omgivningen öppet reaktionskärl och beräkna förändringen i Gibbs fria energi. Konceptuellt skulle vi kunna dela in hela universum i två partitioner, partition 1 som utgörs av vårt reaktionskärl och dess direkta omgivning (t.ex. rummet i vilket vi genomför reaktionen), och partition 2 som utgörs av resten av universum. Om vi antar att partition 1 har mätbara, likformiga intensiva parameterar (temperatur, tryck etc.) skulle vi kunna tillåta oss att diskutera entropin i partition 1, som om den vore i jämvikt. Exempelvis skulle vi kunna tillåta oss att studera kriteriet för termodynamisk spontanitet,
Är detta inte egentligen en olaglig tillämpning av den termodynamiska formalismen? Partition 1 är uppenbarligen inte isolerad från partition 2 och partitionerna kan (och gör!) utbyta t.ex. energi eller principiellt även materia med varandra. Eftersom partition 2 uppenbarligen inte är i jämvikt med avseende på t.ex. energi, och kan utbyta denna energi fritt med partition 1, kan partition 1 inte heller vara i jämvikt, vilket jag hoppas att jag illustrerade med mitt tankeexperiment. Detta innebär att partition 1 inte kan ha en entropi och således borde ekv. (1) vara meningslös. Trots detta fungerar det alldeles utmärkt att använda ekvation (1) för att studera verkliga processer och för att förutspå hur system evolverar över tid, men hur kan det vara så? Varför fungerar detta överhuvudtaget? Det finns strikt sett inte en enda tidpunkt då partition 1 faktiskt är i jämvikt, så den borde aldrig ha någon entropi och därför är det så mystiskt att ekv. (1) faktiskt går att använda och fungerar.
Först tänkte jag att det kanske räcker att vara "tillräckligt nära" jämvikt; att vi kan låtsas som om partition 1 är i jämvikt eftersom den ändå är "tillräckligt nära". Men problemet är att den formella teorin postulerar att entropi är definierad endast i jämvikt, aldrig annars. Att befinna sig "nära" jämvikt gör inte entropin mer väldefinierad.
Så hur ska man tänka här? Hur motiverar vi tillämpningen av den termodynamiska formalismen (t.ex. ekv. (1)) för att beskriva processer som verkar ligga långt utanför dess domän, och hur kommer det sig att det kan fungera så bra?
Din post blev onödigt svår att följa när du bytte tankeexperiment mitt i beskrivningen. Vill du diskutera gaser i behållare (som ju har en analytisk beskrivning med explicita ekvationer), eller reaktioner i kärl som har fördelen av att vara realiserbart med enkel utrustnig och således mer konkret.
Eftersom du är i processen av att finna 'vad frågan är' så är det för mig som läsare inte supertydligt vad ditt problem utgörs av. Det är inte i sig något fel, det är genom att föra dialog med en verklig eller tänkt samtalspartner som vi preciserar våra egna frågor.
Som läsare ser jag två trådar (1) Vad entropi är, och (2) vad jämvikt är och dess relevant för entropi.
Åtminstone en del av din diskussion verkar rota sig i missförstånd om definierbarheten hos entropi som uttryckt i meningen
Nu är alltså partition 1 i jämvikt och har således en väldefinierad entropi medan partition 2 inte befinner sig i jämvikt och därför inte har någon entropi.
Men problemet är att den formella teorin postulerar att entropi är definierad endast i jämvikt, aldrig annars.
Detta verkar bara fel. Entropi är en tillståndsvariabel, så så länge systemet har ett makrotillstånd, dvs effektivt är homogent, så kommer entropin att vara definierad i samma mening som att temperaturen och trycket osv är definierat. I situationer där tryck och temperatur är odefinierade så är entropin också det men det är inget speciellt med entropin som skiljer den från andra intensiva storheter bortsett från att entropi är svårare att mäta.
När ett system (med eller utan partitioner) utvecklas mot jämvikt så ökar entropin men den finns under hela processvägen.
Sedan kan det finnas praktiska skäl att endast beräkna entropiskillnader vid processer två jämviktstillstånd där en extern process förskjuter var jämviktstillståndet befinner sig men det är en analytisk teknik inte en fysikalisk lag.
Jag misstänker att du förväxlat en 'laboratorieprincip' med en definition.
Först tänkte jag att det kanske räcker att vara "tillräckligt nära" jämvikt; att vi kan låtsas som om partition 1 är i jämvikt eftersom den ändå är "tillräckligt nära".
Denna kommentar var i relation till jämvikts-entropi-diskussionen som jag som sagt tror är ett felspår men jag vill fortfarande säga ja med emfas till själva metoden. Verkligheten kan aldrig modelleras i exakt detalj men det som gör fysikaliska lagar så kraftfulla är att små avvikelser mellan verklighet och modell leder till små avvikelser mellan modellens förutsägelser och framtiden.
Jag rekommenderar att du fortsätter försöker att formulera ditt problem genom tankeexperiment men gör det mha exempelvis ideala gaser där du har analytiska uttryck för entropin. Det är inte så lätt att gå från gaser till 'all termodynamik' men är i alla fall en start.
Hej, tack för ditt svar och ursäkta att mitt ursprungsinlägg blev svårföljt. Det första tankeexperimentet var egentligen inte så viktigt för resten av min fråga utan ämnade endast att visa att det är principiellt möjligt för en del av universum att vara i jämvikt medan en annan del inte är i jämvikt så länge det finns något som hindrar ojämvikten från att fortplanta sig.
Detta verkar bara fel. Entropi är en tillståndsvariabel, så så länge systemet har ett makrotillstånd, dvs effektivt är homogent, så kommer entropin att vara definierad i samma mening som att temperaturen och trycket osv är definierat. I situationer där tryck och temperatur är odefinierade så är entropin också det men det är inget speciellt med entropin som skiljer den från andra intensiva storheter bortsett från att entropi är svårare att mäta.
När ett system (med eller utan partitioner) utvecklas mot jämvikt så ökar entropin men den finns under hela processvägen.
Här vet jag inte om jag håller med, men det kanske bara är ett missförstånd från min sida. Jag utgår från standardverket Callen's Thermodynamics and an Introduction to Thermostatistics, där han postulerar:

Om man läser vidare i boken börjar han diskutera systems konfigurationsrum. Detta är hyperrummet som spänns upp av de extensiva parameterarna tillsammans med hyperytan som definieras av den fundamentala relationen . Om en process följer en kurva längs denna hyperyta är systemt i jämvikt i varje punkt av förloppet och då finns det en entropi, en temperatur, ett tryck och så vidare. MEN, om systemet skulle "försvinna" från denna yta under processens gång är systemet inte längre i jämvikt och det finns inte heller någon entropi, någon temperatur eller något tryck.
Att processen tar systemet längs entropiytan på detta sätt är alltså samma sak som att systemet är i jämvikt i varje del av processen. Callen kallar en sådan process för a dense succession of equilibrium states. Vi kanske initialt använde begreppet på olika sätt men förhoppningsvis förstår du vad jag menar.
Det som stör mig är att ingen verklig process tar systemet längs en sådan kurva utan i alla verkliga processer försvinner systemet ständigt från sin entropiyta. Då kan det inte heller finnas någon entropi eller principiellt någon temperatur eller någon annan intensiv parameter, fastän vi har mätverktyg som kan mäta dem. Bara för att man kan göra en mätning betyder det inte att denna har någon särskild mening. Man kan ju t.ex. mäta temperaturen på ett system som evolverar extremt turbulent men det betyder inte att mätresultatet man får har någon betydelse.
Verkligheten kan aldrig modelleras i exakt detalj men det som gör fysikaliska lagar så kraftfulla är att små avvikelser mellan verklighet och modell leder till små avvikelser mellan modellens förutsägelser och framtiden.
Jag diskuterade kort denna fråga med en fysiker jag lyckades komma i kontakt med, och han åberopade också denna heuristik, att små avvikelser från verkligheten i modellen leder till små fel i de förutspådda resultaten. Men jag har väldigt svårt att förstå hur denna heuristik är tillämpbar här.
I vanliga fall då vi simplifierar en modellering vet vi exakt hur vi inför vårt fel och exakt hur det kommer påverka vårt resultat. Om vi exempelvis utsätter ett objekt som har låg friktion mot sitt underlag för en mycket stor kraft kanske vi väljer att försumma friktionskraften. Detta inför ett väldefinierat fel och vi vet exakt hur detta fel kommer påverka våra förutsägelser. Den förenklade modellen ligger fortfarande inom den överhängande teorins domän och då är det rimligt att även idealiseringar kan ge resultat som ligger nära verkligheten.
Vad gäller termodynamiken verkar situationen vara lite annorlunda. Teorins domän är endast jämviktstillstånd och processer som för system genom jämvikter, inget annat. Således är det inte så tydligt vilket fel man inför då man antar att ett system som inte är i jämvikt är i jämvikt, och det är inte heller tydligt hur dessa fel påverkar de förutspådda resultaten. Det finns ingen tydlig "avvikelse från verkligheten" att tala om eftersom t.ex. entropin inte ens är definierad utanför jämvikt; icke-jämvikter ligger utanför teorins domän. Om man antar att ett system som inte är i jämvikt är i jämvikt, och tillskriver det en tänkt entropi, är det inte tydligt för mig hur denna entropi skiljer sig från den "verkliga entropin", för en sådan finns inte ens. Så det är otydligt hur stort fel man inför.
Här vet jag inte om jag håller med, men det kanske bara är ett missförstånd från min sida. Jag utgår från standardverket Callen's Thermodynamics and an Introduction to Thermostatistics, där han postulerar: [...]
I teknisk teoretisk mening så stämmer det att jämvikts-termodynamik inte beskriver icke-jämviktstillstånd men termodynamik beskriver likväl utan problem system som förändras över tid och därmed inte är i jämvikt. Så länge processen är tillräckligt långsam, så som i fallet med en potatis i en varmluftsugn, så kan man prata om termodynamiska egenskaper även när temperaturen är växande.
Men ja, i sak så kommer klassisk termodynamik bara att beskriva relationen mellan start och sluttillstånd, och inte vägen dem emellan i någon detalj. Det är i sig inte någon egenhet hos termodynamik. Kvantmekanik säger inte hur vågfunktionskollaps går till, bara vad som är möjliga tillstånd och sannolikheterna över övergångar.
'MEN, om systemet skulle "försvinna" från denna yta under processens gång är systemet inte längre i jämvikt och det finns inte heller någon entropi, någon temperatur eller något tryck.
Det var väl denna poäng jag ville göra, att detta inte är specifikt för entropi utan alla termodynamiska parametrar.
Men då förstår jag bättre att vi är alltså inte intresserade av entropi specifikt utan mer generellt att försöka rättfärdiga varför en modell som utgår från tids-statiska tillstånd lyckas beskriva dynamiska processer?
Och för det har jag inget bättre än fysikerns pragmatik från tidigare.
I vanliga fall då vi simplifierar en modellering vet vi exakt hur vi inför vårt fel och exakt hur det kommer påverka vårt resultat. Om vi exempelvis utsätter ett objekt som har låg friktion mot sitt underlag för en mycket stor kraft kanske vi väljer att försumma friktionskraften. Detta inför ett väldefinierat fel och vi vet exakt hur detta fel kommer påverka våra förutsägelser. Den förenklade modellen ligger fortfarande inom den överhängande teorins domän och då är det rimligt att även idealiseringar kan ge resultat som ligger nära verkligheten.
Jag tänker effektivt också sådär men det är inte en vetenskaplig grundsanning utan en konsekvens av att newtons mekanik är en så fruktansvärt framgångsrik teori som får oss att kännas som att modellen är verkligheten och att Laplaces demon kan ge oss matematisk olikheter för hur stot felet kommer bli. I verkligheten finns dock inte Laplaces demon och vi vet inte om det finns något fel eller hur stort det är föränn vi gör experiment.
Men då förstår jag bättre att vi är alltså inte intresserade av entropi specifikt utan mer generellt att försöka rättfärdiga varför en modell som utgår från tids-statiska tillstånd lyckas beskriva dynamiska processer?
Ja, precis! Jag försöker alltså förstå hur vi kan rättfärdiga tillämpningen av en teori som endast behandlar jämviktstillstånd i situationer som inte har med jämvikt att göra och ändå få så bra förutsägelser. Det känns som om det måste gå att förstå på något annat sätt än det väldigt otillfredsställande "empirin visar att det funkar".
I teknisk teoretisk mening så stämmer det att jämvikts-termodynamik inte beskriver icke-jämviktstillstånd men termodynamik beskriver likväl utan problem system som förändras över tid och därmed inte är i jämvikt. Så länge processen är tillräckligt långsam, så som i fallet med en potatis i en varmluftsugn, så kan man prata om termodynamiska egenskaper även när temperaturen är växande.
Men stämmer detta verkligen i strikt teoretisk mening? Termodynamiken kan utan problem beskriva idealiserade processer där systemet i varje punkt under processen är i jämvikt (vilket innebär att processen definierar en slät kurva i systemets konfigurationsrum, det som i viss litteratur kallas kvasistatisk), men inte processer som för systemet genom icke-jämviktstillstånd. Man kan även tänka sig att man kan beskriva skillnader i tillståndsvariabler mellan jämvikter även om processen inte är kvasistatisk genom att använda en tänkt, kvasistatisk process som förbinder jämviktstillstånden. Men då kräver vi som sagt att det initiala och det slutgiltiga tillståndet båda är jämviktstillstånd.
I fallet med en verklig ugn som värmer en potatis så kommer processen aldrig vara kvasistatisk, oavsett hur långsamt man värmer den. Så den verkliga processen borde den termodynamiska formalismen aldrig kunna behandla. Det initiala och det slutgiltiga tillståndet är inte heller jämviktstillstånd i strikt mening (och det verkar som om jämvikt inte ens kan existera i verkligheten i strikt, termodynamisk mening), så det borde inte heller finnas någon mening i att föreställa sig en kvasistatisk process som förbinder det initiala och terminala tillståndet, eftersom dessa inte är jämviktstillstånd ändå. Ingenting i uppvärmningen av potatisen borde gå att beskriva med termodynamisk formalism.
Trots detta kan man tydligen, givet att uppvärmningen sker "långsamt nog", eller att det initiala och slutgiltiga tillståndet är "tillräckligt nära jämvikt", missbruka den termodynamiska formalismen och ändå få utmärkta förutsägelser. Det är detta jag finner så mystiskt.
Jag fick ett vagt minne förut om att Callen faktiskt hade skrivit några rader om exakt detta och det hade han! På s. 15 i andra upplagan kan man hitta följande utdrag:
In actuality, few systems are in absolute and true equilibrium. In absolute equilibrium all radioactive materials would have decayed completely and nuclear reactions would have transmuted all nuclei to the most stable of isotopes. Such processes, which would take cosmic times to complete, generally can be ignored. A system that has completed the relevant processes of spontaneous evolution, and that can be described by a reasonably small number of parameters, can be considered to be in metastable equilibrium. Such a limited equilibrium is sufficient for the application of thermodynamics.
In practice the criterion for equilibrium is circular. Operationally, a system is in an equilibrium state if its properties are consistently described by thermodynamic theory!
It is important to reflect upon the fact that the circular character ofthermodynamics is not fundamentally different from that of mechanics. A particle of known mass in a known gravitational field might be expectedto move in a specific trajectory; if it does not do so we do not reject thetheory of mechanics, but we simply conclude that some additional force acts on the particle. Thus the existence of an electrical charge on the particle, and the associated relevance of an electrical force, cannot beknown a priori. It is inferred only by circular reasoning, in that dynamical predictions are incorrect unless the electric contribution to the force is included. Our model of a mechanical system (including the assignment of its mass, moment of inertia, charge, dipole moment, etc.) is "correct" if it yields successful predictions.
Detta är väl egentligen exakt kvintessensen av min fråga här. Om jag förstår honom rätt så menar han att ett system inte måste befinna sig i "sann" jämvikt för att den termodynamiska formalismen ska kunna tillämpas. Istället räcker ett metastabilt jämviktstillstånd. För att veta huruvida ett system befinner sig i ett sådant tillstånd, menar han, måste man (något cirkulärt) helt enkelt se om den termodynamiska formalismen fungerar. Om den fungerar har vi jämvikt och om inte så var systemet tydligen inte i jämvikt.
Förstår du det likadant?
Men han verkar inte motivera varför teorin ska gå att tillämpa på metastabila jämvikter, men det kanske inte behövs?
Hur skulle en teori eller en modell kunna motivera eller förklara sig själv? Det ligger i sakens natur att fysikaliska modeller är rimliga gissningar, formulerade utifrån heuristiker som uppstått i historiska kontexter, och sedan erhåller modellen legitimitet genom att den 'fungerar'.
En modell kan aldrig förklara sig själv.
I sak tror jag att du inte kommer att komma vidare med de här frågeställningarna. Det som följer är en historiskt tolkning av mig men du befinner dig i en återvändsgränd eftersom den klassiska termodynamiska formalismen är teoriagnostisk. Den bryr sig inte om varför. Klassisk termodynamisk formalism är enligt mig en strikt empirisk modell modell som tar sin utgångspunkt vad du kan mäta makroskoskopiskt och tillåter att den underliggande teorin kan vara vilken som helst; newtonsk, kvantmekanisk, Kelvins vortexmateeria. Alla mikroteorier som är någorlunda rimliga kommer vara konsistent med termodynamisk formalism. Detta är å ena sidan en styrka eftersom det är en maskin som bara fungerar, men frågor om varför blir förvirrade eftersom svaret på frågan om varför formalismen fungerar beror av vad du tror ligger under huven vilket formalismen inte kan berätta.
Agnostikformuleringen är för mig inspirerad av förordet till Wanniers "Statistical mechanics" (1966):

I fysikerutbildning så brukar man först ha en introkurs i termodynamik (som ingen fattar), och sedan en kurs i statistik mekanik (som alla tror att de fattar). Jag anser inte att grundläggande statistisk mekanik egentligen löser de fundamentala 'varför fungerar detta?'-problemen med termodynamisk formalism. Men statistiska mekaniken ger de mekanikbevandrade fysikerna sinnesron att det vore möjligt om man verkligen försökte
Sedan springer fysikerna vidare med kanonsiska ensembler, fermidistributioner, kvantfältsmetoder och de/vi är liksom inte så intresserade av att gräva vidare termodynamisk formalism utan drar helt enkelt fram den ur verktygslådan när den behövs och råkar fungera. (Termodynamiken för en gas och en kristall är enkel att härleda med statistisk mekanik så sedan hoppas vi bara att det gäller för alla de andra sakerna också)
Kemister å andra sidan ger mig intrycket av att de är fast i termodynamiska formalismen mycket hårdare eftersom reaktionsproblem är helt hopplösa att modellera med statistisk mekanik och datorsimulationer. Inom kemin känns det som man kommer 'ha det roligare' om man går till labbet och gör några experiment och ser att det verkar fungera snarare än att försöka stirra sig blind på partialderivatorna.
Hur skulle en teori eller en modell kunna motivera eller förklara sig själv? Det ligger i sakens natur att fysikaliska modeller är rimliga gissningar, formulerade utifrån heuristiker som uppstått i historiska kontexter, och sedan erhåller modellen legitimitet genom att den 'fungerar'.
En modell kan aldrig förklara sig själv.
Så är det givetvis och det bestrider jag inte. Jag vet faktiskt inte vad för typ av svar jag sökte. Det var nog en blandning av naiv hoppfullhet och lite önsketänk.
Jag får väl acceptera att om Callen säger att det är sant att det fungerar att tillämpa den axiomatiserade formalismen (som bara behandlar sanna jämvikter) på icke-jämvikter som är tillräckligt jämviktsliknande, tja, då är det väl så helt enkelt. Jag ska läsa vidare och se om han diskuterar detta i närmare detalj längre fram i boken.
Relaterat till denna diskussion hittade jag faktiskt ett väldigt revelvant och upplysande utdrag på s. 79 i andra upplagan av Rational Thermodynamics av Truesdell:
For the slightly disequilibrated professional I will make only two remarks in passing. First, in mechanics the concept of force originated in statics and was carried over bodily, if with much delay and discussion, to motions. If the restoring force exerted by a spring is proportional to the increase of its length in a static experiment, will it still be so when a ball is attached to the end and set into oscillation, especially if the experiment is performed in a spaceship in orbit around the moon? Indeed, does it make sense to talk about forces at all in a moving system? The forces, it seems, might be affected by the motions, yet we are supposed to know the forces first in order to determine what the motion will be. These questions, and far subtler ones of the same kind, were asked in the seventeenth century; today the freshman is trained specifically not to ask them. Perhaps he ought to; but if he does, he is more likely to take up philosophy than science; and if NEWTON had insisted that forces be used only when they can be measured by an operationalist who works and thinks very, very slowly, it is unlikely anyone would be designing spaceships today. The professionals who moan that temperature is a concept for equilibrium alone are not solving any problems themselves; they are merely pronouncing our problems insoluble and sneering at us for trying to solve them.
Second, the professional theorists of thermodynamics show a lack of respect for experiment I find hard to admire. Experiments are being done today in all sorts of extreme conditions. My friends and colleagues tell me they measure the temperatures in polymer solutions undergoing strong normal-stress effects, they control the temperatures in explosion fronts, they infer the temperatures on the skins of artificial satellites. It would be presumptuous on my part to question the details of the work of these men, and I see no reason to deny that they know their business. The temperatures occurring as values of the temperature function in modern theories of materials are intended to represent the numbers these experimenters report and call "temperatures", although their systems bear little likeness to those the old books on thermodynamics describe as being "in equilibrium ", and their processes seem to have little in common with whatever it is the thermodynamicists mean by "quasi-static". I do not claim that we yet know whether or not a particular theory be borne out by any particular experiment, but I do not see why the professionals should forbid us from trying to explain the experiments by a rational theory, approached in that very spirit everyone today regards as the right one for mechanics and electromagnetism.
Men jag tror att jag är med på tänket. Strikt taget behandlar den termodynamiska formalismen endast jämviktstillstånd, men om ett system befinner sig i ett tillstånd som är "tillräckligt likt" ett jämviktstillstånd, kan vi med stor framgång (miss)bruka den termodynamiska formalismen och ändå få bra förutsägelser. Vi tillämpar teorin då i någon mening på "det närmsta jämviktstillståndet" till tillståndet systemet egentligen befinner sig i.
Låter det som en rimlig sammanfattning?