2009-02-01
mail сервера:
- был составлен тендер и оплачена антивирусная лицензия на 500
пользователей на следующие два года для BitDefender'a;
- был сформирован список рассылки afs@ihep.ru для всех пользователей AFS
серверов
www сервера:
системы и железо:
- обновлено firware на promise рейдах: AFS (afssrv01, afssrv02),
NFS(fs0003);
- выполнена установка XEN сервера xen0001, были реализованы две
виртуальные машины (d-cache, pps11)
- Была сделана репликация системного диска для OpenVMS кластера,
осталось проверить работу системы при его использовании.
счетная ферма:
- было удалено устаревшее грид ПО со /storage/nfs001 (для локальных
пользователей высвободилось 138GB)
proxy, dns:
- было составлено предложение на закупку 2х новых серверов, А.М. Зайцев
отложил из-за отсутсвия денег, текущий кластер по прежнему работает в
degradated режиме;
- была выполнена оплата за домены ihep.ru в РУ ЦЕНТР;
AFS, NFS:
- были проблемы при очистке nfs001, поэтому была остановлена и прочекена
файловая система (не понятно от куда вышли ошибки в ней)
- Из-за старой версии AFS, пришлось перенести SCSI карточку и DLT с
afssrv02 на afssrv01, чтоб была возможность сделать бэкап системы
GRID
- были закрыты очереди для alice,cms,lchb, atlas на ce0001;
- был отключен gridICE мониторинг, как устаревший;
- были установлены и настроены серверы dp0010-dp0014;
- выполнена установка и введение в продакшен дисковых пулов
dp0011-dp0012 в dCache;
- пулы были добавлены в мониторинг Nagios, были произведены некоторые
дороботки в системе мониторинга;
- выполнена пробная установка xrootd под виртуальной машиной d-cache;
- начались работы по установке production xrootd для Alice на dp0014;
- Была установлена система мониторинга UPS (winpower) на счетных узлах
wn0057-wn0070 и дисковых серверах dp0010-dp0014, начались работы по
настройке автоматического выключения дисковых серверов в случае аварий с
питанием;
- на se0003 был 18GB лог файл от SRM tomcat'a, рассматриваются способы
его ротейта или отключения;
- осталась непонятная проблема с узлом wn0063, который иногда умирает;
- был установлен патч на ce0003 от gLite3.1 в несколько раз уменьшивший
CPU usage на сервере
Маршрутизаторы и сетевое оборудование:
- Была устранена очень сложная проблема с packetlost'ом до некоторых
сайтов, были проверены все сетевые устройства на канале Internet института.
Разное: