Хабрахабр

Принцип наименьшего действия в аналитической механике

Неоднозначна она потому, что её автор в популярной форме пытается донести до читателя один из основополагающих принципов математического описания природы, и это частично ему удается. Причина данной публикации — неоднозначная статья на тему принципа наименьшего действия (ПНД), опубликованная на ресурсе несколько дней назад. Под спойлером приведена полная цитата данного отрывка Если бы не одно но, притаившееся в конце публикации.

Задача о движении шарика

Не все так просто

На самом деле я немного обманул, сказав, что тела всегда двигаются так, чтобы минимизировать действие. Хотя в очень многих случаях это действительно так, можно придумать ситуации, в которых действие явно не минимально.

На некотором отдалении от него поставим упругую стенку. Например, возьмем шарик и поместим его в пустое пространство. При таких заданных условиях шарик может двигаться двумя разными способами. Допустим, мы хотим, чтобы через некоторое время шарик оказался в том же самом месте. Во-вторых, можно его толкнуть по направлению к стенке. Во-первых, он может просто оставаться на месте. Понятно, что можно толкнуть его с такой скоростью, чтобы он вернулся в точно нужное время. Шарик долетит до стенки, отскочит от нее и вернется обратно.

image

Оба варианта движения шарика возможны, но действие во втором случае получится больше, потому что все это время шарик будет двигаться с ненулевой кинетической энергией.

Об этом мы поговорим в следующий раз.
Как же спасти принцип наименьшего действия, чтобы он был справедлив и в таких ситуациях?

Так в чем же, с моей точки зрения, проблема?
Проблема в том, что автор, приводя данный пример допустил ряд фундаментальных ошибок. Она усугубляется тем, что планируемая вторая часть, со слов автора, будет опираться на эти ошибки. Руководствуясь принципом наполнения ресурса достоверной информацией я вынужден выступить с разъяснением своей позиции по данному вопросу более развернуто, и формат комментариев для этого маловат.

Данная статья расскажет о том, как строится механика на базе ПНД, и постарается объяснить читателю, что проблема, которую ставит автор цитируемой публикации отсутствует.

Действием по Гамильтону называют функционал

$S = \int\limits_^{t_2} \, L\left(\mathbf q(t), \dot{\mathbf q}(t) \right) \, dt$

где

$L\left(\mathbf q(t), \dot{\mathbf q}(t) \right) = T\left(\mathbf q(t), \dot{\mathbf q}(t) \right) - \Pi(\mathbf q)$

— функция Лагранжа, для некоторой механической системы, в которой (опуская аргументы в дальнейшем) T — кинетическая энергия системы; П — потенциальная её энергия; q(t) — вектор обобщенных координат этой системы, являющийся функцией времени. при этом полагают, что моменты времени t1 и t2 — фиксированы.

Потому, что функция, по определению есть правило, по которому одному числу из области определения (аргументу функции) ставится в соответствие другое число из области значений. Почему функционал, а не функция? В данном случае это закон движения механической системы q(t), определенный по крайней мере на промежутке времени между t1 и t2. Функционал отличается тем, что качестве его аргумента выступает не число, а целая функция.

Многолетние (и это мягко сказано!) труды ученых-механиков (включая умопомрачительного Леонарда Эйлера), позволили сформулировать

Принцип наименьшего действия:

Механическая система, для которой задана функция Лагранжа $L\left(\mathbf q(t), \dot{\mathbf q}(t) \right) $, движется таким образом, что закон её движения q(t) доставляет минимум функционалу

$S = \int\limits_{t_1}^{t_2} \, L\left(\mathbf q(t), \dot{\mathbf q}(t) \right) \, dt \to \min$

называемому действием по Гамильтону.

Уже из самого определения ПНД следует тот факт, что данный принцип приводит к уравнениям движения лишь для ограниченного класса механических систем. Для каких? А давайте разберемся.
Как следует из определения, опять таки, функции Лагранжа, ПНД позволяет получить уравнения движения для механических систем, силовое воздействие на которые определяется исключительно потенциальной энергией. Для того чтобы разобраться, о каких системах идет речь, дадим несколько определений, которые, для экономии объема статьи я помещаю под спойлер

Работа силы на перемещении

Кинетическая энергия точки

Кинетической энергией точки T называют работу, которую должны совершить приложенные к точке массой m силы, для того чтобы из состояния покоя перевести точку в движение со скоростью $\vec v$

Вычислим кинетическую энергию, согласно данному определению. Пусть точка начинает движение из состояния покоя под действием приложенных к ней сил. На отрезке траектории AB она приобретает скорость $\vec v$. Вычислим работу, совершенную приложенными к точке силами, которые, по принципу независимости действия сил, заменим равнодействующей $\vec F$

$T = A = \int\limits_{AB} \, \vec F \cdot d\vec s$

В соответствии со вторым законом Ньютона

$\vec F = m \, \vec a = m \, \frac{d\vec v}{dt}$

тогда

$T = \int\limits_{AB} \, \vec F \cdot d\vec s = m \, \int\limits_{AB} \frac{d\vec v}{dt} \, \cdot d\vec s = m \int\limits_{AB} \, \vec v \cdot d\vec v$

Вычислим строго стоящее под знаком интеграла скалярное произведение, для чего продифференцируем по времени скалярное произведение вектора скорости самого на себя

$\frac{d}{dt}(\vec v \cdot \vec v) = \frac{d\vec v}{dt} \cdot \vec v + \vec v \cdot \frac{d\vec v}{dt} = 2 \, \vec v \cdot \frac{d\vec v}{dt} \quad (1)$

С другой стороны,

$\vec v \cdot \vec v = v^2$

Дифференцируя это равенство по времени, имеем

$\frac{d}{dt}(\vec v \cdot \vec v) = \frac{d}{dt}(v^2) = 2 \, v \, \frac{dv}{dt} \quad(2)$

Сравнивая (1) и (2) приходим к выводу, что

$\vec v \cdot d\vec v = v \, dv$

Тогда, спокойно вычисляем работу, раскрывая криволинейный интеграл через определенный, взяв в качестве пределов модуль скорости точки в начале и в конце траектории

$T = m \int\limits_{AB} \vec v \cdot d\vec v = m \int\limits_0^v v \, dv = \frac{m\,v^2}{2}$

Консервативные силы и потенциальная энергия точки

Рассмотрим действующую на точку силу, причем такую, что величина и направление этой силы зависит исключительно от положения точки в пространстве

$\vec F = \vec F(x, y, z)\quad(3)$

Пусть точка перемещается в пространстве по произвольной траектории AB. Вычислим, какую работу при этом совершит сила (3)

$A = \int\limits_{AB} \vec F \cdot d\vec s = \int\limits_{AB} \left(F_x \, dx + F_y \, dy + F_z \, dz\right)$

Так как проекции силы на оси координат зависят исключительно от этих самых координат, всегда можно найти функцию

$U = U(x, y, z)$

такую, что

$F_x = \frac{\partial U}{\partial x},\quad F_y = \frac{\partial U}{\partial y},\quad F_z = \frac{\partial U}{\partial z}$

Тогда, выражение для работы преобразуется к виду

$A = \int\limits_{AB} \left(\frac{\partial U}{\partial x} \, dx + \frac{\partial U}{\partial y} \, dy + \frac{\partial U}{\partial z} \, dz\right) = \int\limits_{U_A}^{U_B} \, dU=U_B - U_A$

где $U_A,\, U_B$ — значения функции U(x, y, z) в точках A и B соответственно. Таким образом работа рассматриваемой нами силы не зависит от траектории точки, а определяется только значениями функции U в начале и в конце траектории. Такая сила называется консервативной силой, а соответствующая ей функция U(x, y, z) — силовой функцией. Очевидно, что $\vec F = \nabla\, U $, а так же равенство нулю работы консервативной силы при движении по замкнутой траектории. Говорят так же, что функция U(x, y, z) задает в пространстве силовое поле.

Потенциальной энергией $\Pi = \Pi(x, y, z)$ точки, в пространстве с заданным силовым полем, называют работу приложенных к ней консервативных сил, которую они совершают при перемещении точки в заданное координатами (x, y, z) положение в пространстве, из некоторого произвольного положения, выбранного в качестве начала отсчета уровня потенциальной энергии.

Выберем на рассмотренной ранее траектории точки произвольную точку O, лежащую между точками A и B. Положим, что в точке потенциальная энергия равна нулю. Тогда

$\Pi_A = U_A - U_O$

— потенциальная энергия точки в положении A, а

$\Pi_B = U_B - U_O$

— потенциальная энергия точки в положении B. Учитывая всё вышесказанное снова вычислим работу потенциальных сил на перемещении из точки A в точку B

$A_{AB} = A_{AO} + A_{OB} = U_A - U_O + U_O - U_B = (U_A - U_O) - (U_B - U_O) = \Pi_A - \Pi_B $

Таким образом, работа консервативных сил равна изменению потенциальной энергии точки, взятому с обратным знаком

$A_{AB} = \Pi_A - \Pi_B = -(\Pi_B - \Pi_A) = -\Delta \Pi$

причем выбор уровня, на котором мы считаем потенциальную энергию равной нулю совершенно не влияет на результат. Отсюда можно сделать вывод, что уровень отсчета потенциальной энергии можно выбрать совершенно произвольно.

Итак, рассмотрим теперь механическую систему, движущуюся под действием потенциальных сил, положение которой однозначно задается вектором обобщенных координат

$\mathbf q = \left[q_1, \, q_2, \, \dots,\, q_s \right]^T\quad(4)$

где s — число степеней свободы данной системы.

Рассмотрим одну из обобщенных координат $q_i = q_i(t)$, полагая аналогичные рассуждения и для всех остальных координат. Действительный, но неизвестный пока нам, закон движения данной системы определяется зависимость обобщенных координат (4) от времени.

Рисунок 1. Действительное и окольное движение механической системы

Выберем два произвольных фиксированных момента времени t1 и t2, полагая t2 > t1. На рисунке зависимость $q_i(t)$ изображена красной кривой. Положение системы $\mathbf q_1 = \mathbf q(t_1)$ договоримся называть начальным положением системы, а $\mathbf q_2 = \mathbf q(t_2)$ — конечным положением системы.

Несмотря на то, что мы задаемся начальным и конечным положением системы, ни первое положение, ни второе, нам заранее неизвестны! Равно как и неизвестен закон движения системы! Однако, я ещё раз настаиваю на том, чтобы нижеследующий текст был прочтен внимательно! Эти положения рассматриваются именно как начальное и конечное положение, безотносительно конкретных значений.

Действительное движение системы будет существовать в единственном варианте (красная кривая), остальные кинематически возможные варианты будем называть окольными движениями $\mathbf q^{*} = \mathbf q^{*}(t)$ (синяя кривая на рисунке). Далее мы полагаем, что из начального положения в конечное система может придти разными путями, то есть зависимость $\mathbf q = \mathbf q(t)$ может быть любой кинематически возможной. Разность между действительным и окольным движением

$\delta q_i(t) = q^{*}_i(t) - q_i(t),\quad \forall i=\overline{1,s}\quad (5) $

будем называть изохронными вариациями обобщенных координат

Малая «дельта» для обозначения выбрана не случайно и подчеркивает принципиальное отличие вариации от дифференциала функции. В данном контексте вариации (5) следует понимать как бесконечно малые функции, выражающие отклонение окольного движения от действительного. В случае с вариацией изменение значения функции при постоянном значении аргумента вызвано изменением вида самой функции! Мы не варьируем аргумент, в роли которого выступает время, поэтому вариация называется изохронной. Дифференциал — главная линейная часть приращения функции, вызванного приращением аргумента. Мы варьируем правило по которому каждому значению времени приводится в соответствие некоторое значение обобщенных координат!

Начальное и конечное состояние определяются действительным законом движения, но я ещё раз подчеркиваю — их конкретные значения нам не известны и могут быть любыми кинематически возможными, мы лишь полагаем, что они существуют и система гарантированно перемещается из одного положения в другое! По сути, мы варьируем закон движения, по которому система из начального состояния перемещается в конечное состояние. В начальном и конечном положении системы мы не варьируем закон движения, поэтому вариации обобщенных координат в начальном и конечном положении равны нулю

$\delta q_i(t_1) = \delta q_i(t_2) = 0,\quad \forall i=\overline{1,s}\quad(6)$

Исходя из принципа наименьшего действия, действительное движение системы должно быть таким, чтобы доставлять минимум функционалу действия. Варьирование координат вызывает изменение функционала действия. Необходимым условием достижения функционалом действия экстремального значения является равенство нулю его вариации

$\delta S = \delta \int\limits_{t_1}^{t2} \, L(q_1,\dots,q_s,\,\dot q_1,\dots,\dot q_s)\,dt = 0\quad(7)$

Решим поставленную нами вариационную задачу, для чего вычислим полную вариацию функционала действия и приравняем её к нулю

$\begin{align} \delta S = & \int\limits_{t_1}^{t2} \, L(q_1 + \delta q_1,\dots,q_s + \delta q_s,\,\dot q_1 + \delta\dot q_1,\dots,\dot q_s + \delta\dot q_s)\,dt - \\ &- \int\limits_{t_1}^{t2} \, L(q_1,\dots,q_s,\,\dot q_1,\dots,\dot q_s)\,dt = 0 \end{align}$

Загоним всё под один интеграл, и так как для вариаций справедливы все операции над бесконечно малыми величинами, преобразуем этот крокодил к виду

$\int\limits_{t_1}^{t_2}\left[ \sum\limits_{i=1}^s \frac{\partial L}{\partial q_i}\delta q_i + \sum\limits_{i=1}^s \frac{\partial L}{\partial \dot q_i}\delta \dot q_i \right]\,dt = 0\quad(8)$

Исходя из определения обобщенной скорости

$\delta \dot q_i = \frac{d(\delta q_i)}{dt} $

Тогда выражение (8) преобразуется к виду

$\int\limits_{t_1}^{t_2}\left[ \sum\limits_{i=1}^s \frac{\partial L}{\partial q_i}\delta q_i \, dt + \sum\limits_{i=1}^s \frac{\partial L}{\partial \dot q_i}d(\delta q_i) \right] = 0$

Второе слагаемое интегрируется по частям

$\sum\limits_{i=1}^s \frac{\partial L}{\partial \dot q_i}\delta q_i|_{t_1}^{t_2} + \int\limits_{t_1}^{t_2}\left[ \sum\limits_{i=1}^s \frac{\partial L}{\partial q_i}\delta q_i - \sum\limits_{i=1}^s \frac{d}{dt}\left(\frac{\partial L}{\partial \dot q_i}\right)\delta q_i \right]\,dt = 0\quad(10)$

Исходя из условия (7), имеем

$\sum\limits_{i=1}^s \frac{\partial L}{\partial \dot q_i}\delta q_i|_{t_1}^{t_2} = 0$

тогда, получаем уравнение

$\int\limits_{t_1}^{t_2}\left[ \sum\limits_{i=1}^s \left( \frac{\partial L}{\partial q_i} - \frac{d}{dt}\left(\frac{\partial L}{\partial \dot q_i}\right) \right) \, \delta q_i \right]\,dt = 0$

При произвольных пределах интегрирования равенство нулю определенного интеграла обеспечивается равенством нулю подынтегральной функции

$\sum\limits_{i=1}^s \left[ \frac{\partial L}{\partial q_i} - \frac{d}{dt}\left(\frac{\partial L}{\partial \dot q_i}\right) \right] \, \delta q_i = 0\quad(11)$

С учетом того, что вариации обобщенных координат независимы, (11) справедливо только в случае равенства нулю всех коэффициентов при вариациях, то есть

$\frac{\partial L}{\partial q_i} - \frac{d}{dt}\left(\frac{\partial L}{\partial \dot q_i}\right) =0, \quad \forall i = \overline{1,s}$

Никто не мешает нам умножить каждое из уравнений на (-1) и получить более привычную запись

$\frac{d}{dt}\left(\frac{\partial L}{\partial \dot q_i}\right) - \frac{\partial L}{\partial q_i} =0, \quad \forall i = \overline{1,s}\quad(12)$

И вот на этом моменте ещё раз внимание — решение вариационной задачи по принципу наименьшего действия, это не функция, доставляющая минимум действию по Гамильтону, а система дифференциальных уравнений, решая которое таковую функцию можно найти. Уравнения (12) и есть решение задачи. В данном случае это дифференциальное уравнение Лагранжа 2-го рода, записанное через функцию Лагранжа, то есть в формулировке для консервативных механических систем.

И всё, на этом принцип наименьшего действия заканчивается, а начинается теория обыкновенных дифференциальных уравнений, которая, в частности, гласит, что решением уравнения (12) является вектор-функция вида

$\mathbf q = \mathbf q(t, C_1, C_2,\dots,C_{2s})$

где C1,...,C2s — произвольные константы интегрирования.

Таким образом

ПНД — фундаментальный принцип, позволяющий получить уравнения движения системы, для которой определена функция Лагранжа

Точка! В задачах аналитической механики вышеперечисленные выкладки больше не нужно проделывать, достаточно использовать их результат (12). Функция, удовлетворяющая уравнению (12) есть закон движения системы, удовлетворяющей ПНД.
Теперь вернемся к той задаче, с которой всё началось — об одномерном движении шарика около абсолютно упругой стенки. Разумеется, для данной задачи можно получить дифференциальные уравнения движения. Так как это дифференциальные уравнения движения, то любое, я подчеркиваю это, любое их решение доставляет минимум функционалу действия, а значит ПНД выполняется! Общее решение уравнений движения шарика можно изобразить в виде так называемого фазового портрета рассматриваемой механической системы. Вот этот фазовый портрет

Рисунок 2. Фазовый портрет системы в задаче с шариком

Может это покажется странным, но данный чертеж отражает все возможные фазовые траектории движения шарика, при любых начальных, или если вам так хочется, краевых условиях. По горизонтальной оси откладывается координата шарика, по вертикальной — проекция скорости на ось x. На самом деле параллельных прямых на графике бесконечно много, на чертеже показаны некоторые из них и направление движения по фазовой траектории.

Каждая из этих фазовых траекторий доставляет минимум функционалу действия, что непосредственно следует из выкладок, проделанных выше. Это — общее решение уравнения движения шарика.

Он говорит: вот шарик покоится, и за промежуток времени от tA до tB действие равно нулю. Что делает автор задачи? Но почему шарик движется к стенке, ведь в покое действие будет меньше? Если шарик толкнуть к стенке, то за тот же промежуток времени действие будет больше, так как у шарика отличная от нуля и неизменная кинетическая энергия. Но мы обязательно решим это в следующей статье. Значит ПНД испытвает проблемы и не работает!

Почему? То что говорит автор — бред. То есть происходит сравнение действия на реальной траектории с действием на тех траекториях, которых нет в природе, и никогда не будет! Да потому, что он сравнивает действия на различных ветвях одной и той же действительной фазовой траектории! Между тем, при применении ПНД, сравнивается действие на действительной траектории и на множестве окольных траекторий.

Объясню ещё более доходчиво. Не понятно? Оно описывается ветвью фазового портрета, совпадающего с осью абсцисс. Рассмотрим состояние покоя. Это действительное движение. Координата не меняется с течением времени. Любое другое кинематически возможное. А какое же движение будет окольным. Задача допускает колебания шарика вдоль оси х? Например малые колебания шарика около рассматриваемого нами положения покоя. Допускает, значит такое движение кинематически возможно и может рассматриваться как одно их окольных

Да потому, что действие в состоянии покоя, вычисленное на фиксированном промежутке времени от tA до tB, будет меньше действия, при малых колебаниях на том же промежутке времени. Почему же шарик таки покоится? В полном соответствии с ПНД. Значит колебаниям и любому другому «шевелению» шарика природа предпочитает покой.

Пусть мы толкнули его как хочет автор, со скоростью, подобранной из краевых условий, так чтобы в момент времени tB шарик оказался в том же положении, откуда стартовал. Допустим мы толкнули шарик в сторону стенки. Ок, это действительное движение. Шарик, с постоянной скоростью долетит до стенки, упруго отскочит и вернется в начальное положение в момент времени tB, опять таки с постоянной скоростью. Например, если шарик будет двигаться к стенке и от стенки со скоростью, меняющейся со временем. Какое движение будет одним из окольных? Возможно. Такое движение возможно кинематически? Да потому, что действие на такой фазовой траектории будет иметь минимальное значение, в сравнении с любом другим вариантом, где скорость зависит от времени. Почему же модуль скорости шарика не меняется?

Ничего такого волшебного тут не происходит. Вот и всё. ПНД работает безо всяких проблем.

ПНД — фундаментальный закон природы. Из него, в частности, вытекают законы механики, например дифференциальные уравнения движения (12). ПНД говорит нам о том, что природа устроена так, что уравнение движения консервативной механической системы выглядит именно как выражение (12) и никак иначе. Большего от него и не требуется.

Не нужно придумывать проблем там где их нет.

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть