Хабрахабр

Принцип наименьшего действия. Часть 2

В данной статье мы разберемся с этим принципом немного подробнее и посмотрим, что происходит в данном примере.
На этот раз нам понадобится чуть больше математики. В прошлый раз мы кратко рассмотрели один из самых замечательных физических принципов — принцип наименьшего действия, и остановились на примере, который, казалось бы, ему противоречит. Чуть более строгие и сложные моменты я буду выделять цветом, их можно пропустить без ущерба для основного понимания статьи. Однако основную часть статьи я опять постараюсь изложить на элементарном уровне.

Граничные условия

Начнем мы с самого простого объекта – шара, свободно двигающегося в пространстве, на который не действуют никакие силы. Такой шар, как известно, двигается равномерно и прямолинейно. Для простоты, предположим, что он двигается вдоль оси $x$:

Например задается, что в начальный момент времени $t_A$ шар находился в точке $A$ с координатой $x_A$ и имел скорость $v_A$. Чтобы точно описать его движение, как правило, задаются начальные условия. Такой способ задания начальных условий очень естественен и интуитивно привычен. Задав начальные условия в таком виде, мы однозначно определяем дальнейшее движение шара — он будет двигаться с постоянной скоростью, и его положение в момент времени $t$ будет равно начальному положению плюс скорость, умноженная на прошедшее время: $x(t) = x_A + v_A \cdot (t-t_A)$. Мы задали всю необходимую информацию о движении шара в начальный момент времени, и дальше его движение определяется законами Ньютона.

Другой альтернативный способ – это задать положение шара в два разных момента времени $t_A$ и $t_B$. Однако это не единственный способ задания движения шара. задать, что: Т.е.

1) в момент времени $t_A$ шар находился в точке $A$ (с координатой $x_A$);
2) в момент времени $t_B$ шар находился в точке $B$ (с координатой $x_B$).

В момент времени $t_A$ он мог пролетать через точку $A$. Выражение «находился в точке $A$» не означает, что шар покоился в точке $A$. То же самое относится и к точке $B$. Имеется ввиду, что его положение в момент времени $t_A$ совпадало с точкой $A$.

Его движение легко вычислить. Эти два условия также однозначно определяют движение шара. Положение шара в момент времени $t$ будет опять равно начальному положению плюс скорость, умноженная на прошедшее время: Чтобы удовлетворить обоим условиям, скорость шара, очевидно должна быть $(x_B-x_A)/(t_B-t_A)$.

$x(t) = x_A + ((x_B-x_A)/(t_B-t_A)) \cdot (t-t_A)$

Заметьте, что в условиях задачи нам не потребовалось задавать начальную скорость. Она однозначно определилась из условий 1) и 2).

Возможно, непонятно зачем вообще может потребоваться задавать их в таком виде. Задание условий вторым способом выглядит непривычно. Однако, в принципе наименьшего действия используются именно условия в виде 1) и 2), а не в виде задания начального положения и начальной скорости.

Траектория с наименьшим действием

Теперь немного отвлечемся от реального свободного движения шара и рассмотрим следующую чисто математическую задачу. Допустим, у нас есть шар, который мы можем вручную перемещать каким угодно способом. При этом нам нужно выполнить условия 1) и 2). Т.е. в промежуток времени между $t_A$ и $t_B$ мы должны переместить его из точки $A$ в точку $B$. Это можно сделать совершенно разными способами. Каждый такой способ мы будем называть траекторией движения шара и он может быть описан функцией положения шара от времени $x(t)$. Отложим несколько таких траектории на графике зависимости положения шарика от времени:

Или мы можем половину времени держать его в точке $A$, а затем с двойной скоростью переместить в точку $B$ (синяя траектория). Например, мы можем перемещать шарик с одной и той же скоростью, равной $(x_B-x_A)/(t_B-t_A)$ (зеленая траектория). Можно двигать его взад и вперед (красная траектория). Можно сперва двигать его в противоположную от $B$ сторону, а затем уже переместить в $B$ (коричневая траектория). В общем, можно передвигать его как угодно, лишь бы соблюдались условия 1) и 2).

В нашем примере, т.е. Для каждой такой траектории мы можем сопоставить число. в отсутствии каких-либо сил, действующих на шар, это число равняется общей накопленной кинетической энергии за все время его движения в промежуток времени между $t_A$ и $t_B$ и называется действием.

Реально кинетическая энергия нигде не накапливается, накопление используется лишь для вычисления действия для траектории. В данном случае слово «накопленная» кинетическая энергия не очень точно передает смысл. В математике для такого накопления имеется очень хорошее понятие — интеграл:

$S = \int\limits_^{t_B} Tdt$

Действие обычно обозначается буквой $S$. Символ $T$ означает кинетическую энергию. Данный интеграл означает, что действие равно накопленной кинетической энергии шара за промежуток времени от $t_A$ до $t_B$.

В качестве примера, давайте возьмем шар массой 1 кг., зададим какие-нибудь граничные условия и вычислим действие для двух разных траекторий. Пусть точка $B$ находится на расстоянии 1 метр от точки $A$, а время $t_B$ отстоит от времени $t_A$ на 1 секунду. Т.е. мы должны переместить шар, который в начальный момент времени был в точке $A$, за одну секунду на расстояние 1 м. вдоль оси $x$.

с одинаковой скоростью, которая, очевидно, должна быть равна: $v=1$ м/с. В первом примере (зеленая траектория) мы перемещали шар равномерно, т.е. За одну секунду накопится 1/2 Дж $\cdot$ с кинетической энергии. Кинетическая энергия шара в каждый момент времени равна: $Т = mv^2/2$ = 1/2 Дж. действе для такой траектории равно: $S = 1/2$ Дж $\cdot$ с. Т.е.

В первые полсекунды шар покоится и его кинетическая энергия равна нулю. Теперь давайте шар будем не сразу переносить из точки $A$ в точку $В$, а полсекунды придержим его в точке $A$, а затем, за оставшееся время равномерно перенесем его в точку $B$. Вторые полсекунды мы переносим шар с двойной скоростью: $v=2$ м/с. Поэтому вклад в действие этой части траектории также равен нулю. Вклад этого промежутка времени в действие будет равен 2 Дж умножить на полсекунды, т.е. Кинетическая энергия при этом будет равна $Т = mv^2/2$ = 2 Дж. Поэтому общее действие для такой траектории получается равно $S = 1$ Дж $\cdot$ с. 1 Дж $\cdot$ с.

Среди всех таких траекторий имеется траектория, у которой действие меньше всего. Аналогично, любой другой траектории с заданными нами краевыми условиями 1) и 2) соответствует некоторое число, равное действию для данной траектории. равномерное движение шара. Можно доказать, что этой траекторией является зеленая траектория, т.е. Для любой другой траектории, какой бы хитрой она не была, действие будет больше 1/2.

Достаточно часто в физике и математике возникают задачи подобные нашей, т.е. В математике такое сопоставление для каждой функции определенного числа называется функционалом. Например, одна из задач, имевших большое историческое значение для развития математики – это задача о бахистохроне. на отыскание такой функции, для которой значение определенного функционала минимально. нахождение такой кривой, по которой шарик скатывается быстрее всего. Т.е. Снова задача сводится к нахождению такой функции, для которой значение функционала минимально. Опять, каждую кривую можно представить функцией h(x), и каждой функции сопоставить число, в данном случае время скатывания шарика. Область математики, которая занимается такими задачами называется вариационным исчислением.

Принцип наименьшего действия

В разобранных выше примерах у нас появились две особые траектории, полученные двумя разными способами.

Первая траектория получена из законов физики и соответствует реальной траектории свободного шара, на который не действуют никакие силы и для которого заданы граничные условия в виде 1) и 2).

Вторая траектория получена из математической задачи нахождения траектории с заданными граничными условиями 1) и 2), для которой действие минимально.

Другими словами, если известно, что шарик двигался так, что выполнялись граничные условия 1) и 2), то он обязательно двигался по траектории, для которой действие минимально по сравнению с любой другой траекторией с теми же самыми граничными условиями. Принцип наименьшего действия утверждает, что эти две траектории должны совпадать.

Мало ли задач, в которых появляются равномерные траектории и прямые линии. Можно было бы посчитать это простым совпадением. Для этого только нужно заменить кинетическую энергию на разность кинетической и потенциальной энергии. Однако принцип наименьшего действия оказывается очень общим принципом, справедливым и в других ситуациях, например, для движения шара в равномерном поле тяжести. Фактически, функция Лагранжа содержит всю необходимую информацию о динамических свойствах системы. Эту разность называют Лагранжианом или функцией Лагранжа и действие теперь становится равно общему накопленному Лагранжиану.

Именно эта парабола совпадет с траекторий, для которой действие будет минимально.
Если мы запустим шар в равномерном поле тяжести таким образом, чтобы он пролетел точку $A$ в момент времени $t_A$ и прилетел в точку $B$ в момент времени $t_B$, то он, согласно законам Ньютона полетит по параболе.

Кинетическая энергия $T$ зависит от скорости тела, а потенциальная — от его положения, т.е. Таким образом, для тела, двигающегося в потенциальном поле, например, в гравитационном поле Земли, функция Лагранжа равна: $L = T(v)-V(x,y,z)$. В аналитической механике всю совокупность координат, определяющих положение системы, обычно обозначают одной буквой $q$. координат $x,y,z$. Для шара, свободно двигающегося в поле тяжести, $q$ означает координаты $x$, $y$ и $z$.

Например, $\dot x$ обозначает скорость изменения координаты $x$, или, иными словами, скорость тела в направлении $x$. Для обозначения скорости изменения какой-либо величины, в физике очень часто просто ставят точку над этой величиной. Т.е. Используя эти соглашения, скорость нашего шара в аналитической механике обозначается как $\dot q$. $\dot q$ означает компоненты скорости $v_x, v_y, v_z$.

Поскольку функция Лагранжа зависит скорости и координат, а также может явно зависеть от времени (явно зависит от времени означает, что значение $L$ в разные моменты времени разное, при одинаковых скоростях и положениях шара) то действие в общем виде записывается как

$S = \int\limits_{t_A}^{t_B} L(\dot q,q,t)dt$

Не всегда минимальное

Однако в конце предыдущей части мы рассмотрели пример, когда принцип наименьшего действия явно не работает. Для этого мы опять взяли свободный шарик, на который не действуют никакие силы и поместили рядом с ним пружинящую стенку.

Граничные условия мы задали такими, что точки $A$ и $B$ совпадают. Т.е. и в момент времени $t_A$ и в момент времени $t_B$ шар должен оказаться в одной и той же точке $A$. Одной из возможных траекторий будет являться стояние шара на месте. Т.е. весь промежуток времени между $t_A$ и $t_B$ он простоит в точке $A$. Кинетическая и потенциальная энергия в этом случае будут равны нулю, поэтому действие для такой траектории также будет равно нулю.

Однако изменение значения потенциальной энергии не влияет на отыскание траектории с минимальным действием. Строго говоря, потенциальную энергию можно взять равной не нулю, а любому числу, поскольку важна разность потенциальной энергии в разных точках пространства. Для удобства, для нашего шара мы выберем потенциальную энергию равной нулю. Просто для всех траекторий значение действия изменится на одно и то же число, и траектория с минимальным действием так и останется траекторией с минимальным действием.

Другой возможной физической траекторией с теми же граничными условиями будет траектория при которой шарик сначала летит вправо, пролетая точку $A$ в момент времени $t_A$. Затем он сталкивается с пружиной, сжимает ее, пружина, распрямляясь, отталкивает шарик обратно, и он опять пролетает мимо точки $A$. Можно подобрать скорость движения шара такой, чтобы он, отскочив от стенки, пролетел точку $A$ точно в момент $t_B$. Действие при такой траектории будет в основном равно накопленной кинетической энергии во время полета между точкой $A$ и стенкой и обратно. Будет какой-то промежуток времени, когда шарик сожмет пружину и его потенциальная энергия увеличится, и в этот промежуток времени потенциальная энергия внесет отрицательный вклад в действие. Но такой промежуток времени будет не очень большим и сильно действие не уменьшит.

Зеленая траектория соответствует покоящемуся шару, в то время как синяя соответствует шару, отскочившему от пружинящей стенки. На рисунке нарисованы обе физически возможные траектории движения шара.

У второй траектории действие больше. Однако минимальным действием обладает только одна из них, а именно первая! Т.е. Получается, что в данной задаче имеются две физически возможных траектории и всего одна с минимальным действием. в данном случае принцип наименьшего действия не работает.

Стационарные точки

Чтобы понять в чем тут дело, давайте отвлечемся пока от принципа наименьшего действия и займемся обычными функциями. Давайте возьмем какую-нибудь функцию $y(х)$ и нарисуем ее график:

Что является общим для этих точек? На графике я отметил зеленым цветом четыре особенных точки. Четыре обозначенных точки особенны тем, что если установить шарик точно в данную точку, то он никуда не укатится. Представим, что график функции – это реальная горка, по которой может катиться шарик. Такие точки называют стационарными. Во всех остальных точках, например, точке E он не сможет устоять на месте и начнет скатываться вниз. Нахождение таких точек является полезной задачей, поскольку любой максимум или минимум функции, если она не имеет резких изломов, обязательно должен являться стационарной точкой.

ее значение меньше, чем любое другое значение функции. Если точнее классифицировать данные точки, то точка A является абсолютным минимумом функции, т.е. Точка С называется локальным максимумом, т.е. Точка B – не является ни максимумом, ни минимумом и называется седловой точкой. А точка D – локальным минимумом, т.е. значение в ней больше, чем в соседних точках функции. значение в ней меньше, чем в соседних точках функции.

По другому его еще иногда называют анализом бесконечно малых, поскольку он умеет работать с бесконечно малыми величинами. Поиском таких точек занимается раздел математики, называемый математическим анализом. Чтобы понять, что это за свойство, нам нужно понять, как выглядит функция на очень малых расстояниях от этих точек. С точки зрения математического анализа стационарные точки обладают одним особенным свойством, благодаря которому их и находят. На рисунке показано как выглядит функция в окрестности различных точек при различном увеличении. Для этого мы возьмем микроскоп и посмотрим в него на наши точки.

при очень малых отклонениях x) стационарные точки выглядят абсолютно одинаково и сильно отличаются от нестационарной точки. Видно, что при очень большом увеличении (т.е. Именно поэтому шарик, установленный в стационарной точке, не будет скатываться. Легко понять в чем заключается это отличие – график функции в стационарной точке при увеличении становится строго горизонтальной линией, а в нестационарной – наклонной.

Функция же в нестационарной точке при малом изменении $x$ меняется пропорционально изменению $x$. Горизонтальность функции в стационарной точке можно выразить по другому: функция в стационарной точке практически не меняется при очень малом изменении своего аргумента $x$, даже по сравнению с самим изменением аргумента. На самом деле, функция при увеличении становится все больше похожа на касательную к графику в рассматриваемой точке.
И чем больше угол наклона функции, тем сильнее меняется функция при изменении $x$.

На строгом математическом языке выражение «функция практически не меняется в точке $x_0$ при очень малом изменении $x$» означает, что отношение изменения функции и изменения ее аргумента $∆y/∆x$ стремится к 0 при $∆x$ стремящемся к 0:

$$display$$\lim_{∆x \to 0} \frac {∆y(x_0)}{∆x} = \lim_{x \to 0} \frac {y(x_0+∆x)-y(x_0)}{∆x} = 0$$display$$

Это же число называют производной функции в данной точке. Для нестационарной точки это отношение стремится к ненулевому числу, которое равно тангенсу угла наклона функции в этой точке. Таким образом, стационарные точки – это точки, в которых производная функции равна 0.
Производная функции показывает, насколько быстро меняется функция около данной точки при небольшом изменении ее аргумента $x$.

Стационарные траектории

По аналогии со стационарными точками можно ввести понятие стационарных траекторий. Вспомним, что у нас каждой траектории соответствует определенное значение действия, т.е. какое-то число. Тогда может найтись такая траектория, что для близких к ней траекторий с теми же граничными условиями, соответствующие им значения действия практически не будут отличаться от действия для самой стационарной траектории. Такая траектория называется стационарной. Другими словами, любая траектория близкая к стационарной будет иметь значение действия, очень мало отличающееся от действия для этой стационарной траектории.

Допустим, что у нас задан функционал $S(x(t))$ для функций с требуемыми граничными условиями 1) и 2), т.е. Опять, на математическом языке «мало отличающееся» имеет следующий точный смысл. Допустим, что траектория $x(t)$ – стационарна. $x(t_A)=A$ и $x(t_B)=B$.

$g(t_A)$ = $g(t_B)$ = 0. Мы можем взять любую другую функцию $g(t)$, такую, что на концах она принимает нулевые значения, т.е. Из этих двух функций и переменной $ε$ мы можем составить третью функцию $x'(t) = x(t) + εg(t)$, которая также будет удовлетворять граничным условиям $f'(t_A)=A$ и $f'(t_B)=B$. Также возьмем переменную $ε$, которую мы будем делать все меньше и меньше. При уменьшении $ε$ траектория, соответствующая функции $x'(t)$, будет все сильнее приближаться к траектории $x(t)$.

Т.е. При этом для стационарных траекторий при малых $ε$ значение функционала у траекторий $x'(t)$ будет отличаться очень мало от значения функционала для $x(t)$ даже по сравнению с $ε$.

$$display$$\lim_{ε \to 0} \frac {S(x'(t))-S(x(t))}ε=\lim_{ε \to 0} \frac {S(x(t)+εg(t))-S(x(t))}ε = 0$$display$$

При чем это должно быть справедливо для любой траектории $g(t)$, удовлетворяющей граничным условиям $g(t_A)$ = $g(t_B)$ = 0.

От термина «вариация» и происходит название «вариационное исчисление». Изменение функционала при малом изменении функции (точнее, линейная часть изменения функционала, пропорциональная изменению функции) называется вариацией функционала и обозначается $δS$.

Для стационарных траекторий вариация функционала $δS=0$.

Оказывается, что стационарная функция, чей функционал выражается интегралом, подобным интегралу действия, должна удовлетворять определенному уравнению, которое теперь называется уравнением Эйлера-Лагранжа.
Метод нахождения стационарных функций (не только для принципа наименьшего действия, но и для многих других задач) нашли два математика — Эйлер и Лагранж.

Принцип стационарного действия

Ситуация с минимумом действия для траекторий аналогична ситуации с минимумом для функций. Чтобы траектория обладала наименьшим действием, она обязана быть стационарной траекторией. Однако не все стационарные траектории – это траектории с минимальным действием. Например, стационарная траектория может иметь минимальное действие локально. Т.е. у нее действие будет меньше, чем у любой другой соседней траектории. Однако где-то далеко могут находиться другие траектории, для которых действие будет еще меньше.

Они могут двигаться по более широкому набору особых траекторий, а именно -стационарным траекториям. Оказывается, реальные тела могут двигаться не обязательно по траекториям с наименьшим действием. реальная траектория тела всегда будет стационарной. Т.е. Однако по сложившейся традиции его часто называют принципом наименьшего действия, подразумевая по этим не только минимальность, но и стационарность траекторий.
Поэтому принцип наименьшего действия правильнее назвать принципом стационарного действия.

Теперь мы можем записать принцип стационарного действия на математическом языке, как его обычно записывают в учебниках:

$δS=δ\int\limits_{t_A}^{t_B} L(\dot q,q,t)dt = 0$

.

набор переменных, однозначно задающих положение системы.
$\dot q$ — скорости изменения обобщенных координат.
$L(\dot q,q,t)$ — функция Лагранжа, которая зависит от обобщенных координат, их скоростей и, возможно, времени.
$S$ — действие, которое зависит от конкретной траектории движения системы (т.е. Здесь $q$ — это обобщенные координаты, т.е. от $q(t)$).

для них вариация действия $δS=0$.
Реальные траектории системы стационарны, т.е.

Если вернуться к примеру с шаром и упругой стенкой, то объяснение этой ситуации теперь становится очень простым. При заданных граничных условиях, что шар должен и во время $t_A$ и во время $t_B$ оказаться в точке $A$ существуют две стационарные траектории. И по любой из этих траекторий может реально двигаться шар. Чтобы явно выбрать одну из траекторий, можно на движение шара наложить дополнительное условие. Например, сказать, что шар должен отскочить от стенки. Тогда траектория определится однозначно.

Из принципа наименьшего (точнее стационарного) действия следуют некоторые замечательные следствия, о которых мы поговорим в следующей части.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть