OpenQuality.ru

Качество программного обеспечения

Качество программного обеспечения: в главных ролях

Лента  Радар  Блог  Опыт  
Разум  Видео  Заметки  Эпизоды


Билет в пустоту, или SOS в недрах SLES

Добрый день.

Сбой в программной системе может нарушить работу предприятия и спасти человеческую жизнь.

Джеймс и Сильвия Морган, Бостон

20 мая, 21:57

Джеймс Морган, ученый-кардиолог с мировым именем, был вне себя. Посадка на рейс CEA764 Бостон - Пекин заканчивалась через 30 минут, а он не мог пройти предполетную регистрацию. Джеймс с возмущением тряс распечаткой электронного билета перед глазами менеджера Chinese Empire Airlines. Великая китайская стена. Вышколенный представитель авиакомпании с ледяным спокойствием и дежурной улыбкой в третий раз повторил: сведений о пассажире Джеймсе Моргане нет в базе авиакомпании. Что делать? Офис гарвардского транспортного агентства закрыт. В голове промелькнула мысль: “Университет оплатит издержки”. Джеймс сдался, конференция в Пекине пройдет без него.

“Сэр!”, – cлужащий авиакомпании оторвал взгляд от экрана и растерянно улыбнулся. “Хм, еще не все потеряно!”, – Джеймс приготовился слушать.

20 мая, 23:11

Сильвия Морган застыла перед экраном телевизора. Агентство Reuters сообщает: самолет авиакомпании Chinese Empire Airlines в среду, 20 мая, в 23:08 пропал с экранов радаров. В момент исчезновения Boeing 737-800 находился над штатом Огайо. По словам представителя авиакомпании, есть вероятность того, что на самолете, следовавшем рейсом CEA764, возникли неполадки с радиосвязью.

Cерверная площадка Chinese Empire Airlines, Пекин

18 мая, 09:46

Сервер, управляющий системой бронирования билетов. Сообщение в /var/log/messages:

May  18 09:46:43 falco10q tickdb_backup: Operation successfully finished

Запуск задания из crontab. Резервное копирование информации из базы авиакомпании завершено. Данные сохранены во вспомогательном RAID-хранилище.

18 мая, 14:30

Запланированный переезд системы на новую платформу. 32 процессора dual core, новая версия OS – переход с SUSE Linux Enterprise Server (SLES) 9 на SLES 10. Значительный прирост в производительности. Функциональность на новой платформе проверена, все тестовые испытания прошли успешно, данные синхронизированы.

18 мая, 17:21

Нет, еще не все. Забывчивость сисадмина. Собрана и установлена новая версия Linux-ядра 2.6.29, в которой улучшено управление памятью и разделом подкачки (проверено на вспомогательном сервере). Рестарт OS для загрузки нового ядра намечен на 3 часа утра местного времени в момент наименьшей нагрузки на систему. Runlevel: 5. Скрипт запуска системы управления:

falco10q:/dev # ls -l /etc/rc.d/rc5.d/ | grep tickets
lrwxrwxrwx 1 root root 17  May 18 17:01 S16ticketsdb -> ../ticketsdb

18 мая, 23:22

Успешная транзакция в системе бронирования. Электронный билет на имя Джеймса Моргана, бизнес-класс, рейс CEA764, 20 мая.

Traveller	Seat number 	Seat location	Meal preference
James Morgan 	None specified 	None specified 	No special meal

Flight: confirmed	

Departure:	Monday, May 20, 2009 22:25	Boston, USA, Logan International, terminal 11
Arrival:	Monday, May 20, 2009 03:50 + 1day Beijing, China, Capital Airport, terminal 3 

Airline:	Chinese Empire Airlines, CEA764
Aircraft:	Boeing 737-800
Last check in:	information not available

Fare type:	Business
Baggage:	35 kilogram(s) per traveller

19 мая, 03:07

Перезагрузка OS завершена. Up and running? SMS-оповещение, дублирующее информацию от syslog-ng, нарушает сон сисадмина:

May  19 03:04:43 falco10q ticketsdb:
Cannot open /dev/tickets_sync for writing (No such device available)

Модуль синхронизации с резервным хранилищем не активирован. К моменту его старта не было доступно устройство /dev/tickets_sync (об этом позже). Задание по резервному копированию не выполнено.

19 мая, 03:25

Удаленное подключение к falco10q. Ручной перезапуск системы успешен:

falco10q:~ # /etc/init.d/ticketsdb restart
All subsystems started successfully.

Резервное сохранение данных будет выполнено в 09:45 согласно расписанию в crontab.

Окончание следует.

Отправить в Twitter, Facebook, ВКонтакте | Опубликовано 17.06.2009 в рубрике "Приложения"

Комментарии (3)

  1. Pingback : OpenQuality.ru | Разбор полетов, или неисповедимы пути Системы | July 2, 2009

    […] истории с Boeing […]


  2. Автор комментария : Сергей | April 7, 2012

    До Апокалипсиса совсем недалеко :)

    [Ответить]

    Капитан отвечает:

    Полагаю, с этим лучше повременить :)

    [Ответить]



Добавить комментарий

Пожалуйста, исправьте результат: дважды два равно



КРАТКОЕ СОДЕРЖАНИЕ

Что такое качество программного обеспечения и как его улучшить: теория и практика, задачи и решения, подводные камни и обходные пути.


ПУТЕВОДИТЕЛЬ

Проект был основан в 2008 году. За это время часть статей устарела, а некоторые из них вызывают улыбку, но пусть они останутся в том виде, в котором были написаны. Cписок всех статей с краткой аннотацией и разбивкой по рубрикам: открыть.

ПОДПИСКА

Доступ к самым интересным материалам по электропочте и RSS. Подробности.

ИЩЕЙКА