Хабрахабр

Релиз PVS-Studio 6.26

PVS-Studio 6.26

Обычно мы не пишем заметки про выход новой версии анализатора PVS-Studio. Однако в новый релиз вошло много интересных изменений, касающихся анализа C и C++ кода, о которых хочется рассказать нашим пользователям.

Скоро Java

Если честно, самые последние и интересные нововведения в PVS-Studio пока всё ещё скрыты. Я имею в виду поддержку в анализаторе языка Java. Пока ещё нет публичной beta-версии PVS-Studio for Java, но она очень скоро появится. Если есть желание принять участие в её тестировании, то можно написать нам в поддержку (выбрать: Хочу анализатор для Java).

Новые диагностики для C и C++

В новой версии мы немного увлеклись и добавили сразу 15 диагностик общего назначения для C и C++ (V1021-V1035). В минорном релизе ещё никогда не добавлялось сразу столько диагностик. Подробнее с каждой из диагностик можно ознакомиться в документации. На мой взгляд, наиболее интересными среди новых диагностик являются:

  • V1026. The variable is incremented in the loop. Undefined behavior will occur in case of signed integer overflow.
  • V1033. Variable is declared as auto in C. Its default type is int.

Диагностика V1026 создана по мотивам дискуссии на форуме linux.org.ru. Программист жаловался на глюк в компиляторе GCC 8, но, как затем выяснилось, виной всему является некорректный код, приводящий к неопределённому поведению. Давайте рассмотрим этот случай.

При этом на целевой платформе тип char является беззнаковым. Примечание. В оригинальной дискуссии переменная s имеет тип const char *s. Поэтому для наглядности я сразу написал в примере, что тип указателя — это const unsigned char *.

int foo(const unsigned char *s)
return r & 0x7fffffff;
}

Компилятор не генерирует код для оператора побитового И (&). Из-за этого функция возвращает отрицательные значения, хотя по задумке программиста этого происходить не должно.

Но на самом деле неправ программист, который написал такой код. Разработчик считает, что это глюк в компиляторе. Функция работает неправильно из-за того, что в ней возникает неопределённое поведение.

Переполнения переменной r произойти не должно. Компилятор видит, что в переменной r считается некоторая сумма. Итак, компилятор считает, что раз значение в переменной r после окончания цикла не может быть отрицательным, то операция r & 0x7fffffff для сброса знакового бита является лишней и компилятор просто возвращает из функции значение переменной r. Иначе это неопределённое поведение, которое компилятор никак не должен рассматривать и учитывать.

Чтобы исправить код, достаточно считать хеш, используя для этого беззнаковую переменную. Диагностика V1026 как раз и предназначена для выявления подобных ошибок. Исправленный вариант кода:

int foo(const unsigned char *s)
{ unsigned r = 0; while(*s) { r += ((r * 20891 + *s *200) | *s ^ 4 | *s ^ 3) ^ (r >> 1); s++; } return (int)(r & 0x7fffffff);
}

Теперь давайте рассмотрим другую диагностику V1033. Она интересна тем, что причиной возможных ошибок стало новое ключевое слово auto, появившееся в C++11. Причём виновато не само нововведение языка C++11, а нюансы психологического плана :). Сейчас поясню. Взгляните на этот код:

float d = 3.14f;
int i = 1;
auto sum = d + i;

Видите в нём ошибку? Подумайте. Вот картинка, чтобы сразу не читать текст дальше.

Время подумать

Догадались, что может быть не так? Если нет, вот ещё интересная информация. Переменная sum будет равна 4, а не 4.14. Почему?

Хз

Сейчас читатель скажет, что это была нечестная загадка! Всё дело в том, что это не C++, а C.

Программист привыкает к использованию auto в C++ и случайно может воспользоваться этим словом в C. Бывает, что в проекте одновременно используется и C++, и старый добрый C. Вот только там оно означает совсем другое:

auto

Keyword auto uses the following syntax: Defines a local variable as having a local lifetime.

[auto] data-definition;

As the local lifetime is the default for local variables, auto keyword is extremely rarely used.

Получается, что переменная sum имеет тип int, и именно поэтому её значение будет равно 4.

Единорог смеётся

Хоть ошибка может показаться экзотичной, на самом деле в проекте, где используется смесь из C и C++ файлов, её сделать очень легко. Соответственно, PVS-Studio при анализе C-файлов предупреждает о подобных подозрительных конструкциях.

Другие нововведения

Добавлена возможность проверять проекты для сборочной системы Waf.

В этой версии добавлена поддержка проверки проектов для GNU Arm Embedded Toolchain, Arm Embedded GCC compiler. Мы продолжаем развивать анализатор в сторону встроенных систем.

Доработка со стороны выглядит проще, чем является на самом деле. При анализе проектов для Visual C++ компилятора (cl.exe, проекты vcxproj для Visual Studio/Standalone), в отчёте анализатора теперь сохраняется регистр в путях до проверенных файлов. И приходится в анализаторе восстанавливать их обратно. При препроцессировании файлов компилятор cl.exe портит регистр в именах файлов.

Добавлена возможность использовать pvsconfig файлы с CLMonitor/Standalone на Windows.

PVS-Studio CMake модуль можно теперь использовать на Windows для проектов, использующих компилятор Visual C++ (cl.exe). Добавлен режим инкрементального анализа для pvs-studio-analzyer/CMake модуля.

NET Core/. Добавлена поддержка инкрементального анализа для . NET Standard Visual Studio проектов.

Дополнительные ссылки

  1. PVS-Studio. История версий.
  2. Андрей Карпов. Undefined behavior ближе, чем вы думаете.
  3. Will Dietz, Peng Li, John Regehr, and Vikram Adve. Understanding Integer Overflow in C/C++.
  4. Егор Бредихин. Разработка нового статического анализатора: PVS-Studio Java.
Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»