Центр Коллективного Пользования (ЦКП) "Биоинформатика"

Комплект оборудования ЦКП "Биоинформатика"

Кластер

Собран на основе 4-х шасси HP BladeSystem с7000 c 64 серверами HP BL2х220c G6 пиковой производительностью RPeak = 10362 GFlops; 1024 ядра.

Комплектация серверов BL2х220c G6 состоящих из 2-х модулей (на 1 модуль по 2 процессора, 6 слотов DIMM и одному жесткому диску):

Управляющий узел кластера на основе сервера HP DL360 G6.

Комплектация:

Параллельная система хранения данных

Основана на технологии X9300 Network Storage Gateway. Доступный дисковый объем - до 48 ТБ.

Комплектация:

  • 4 шлюзовых сервера на базе HP DL380 G6 (Intel Xeon E5520, архитектура x86-64, тактовая частота 2.26 ГГц, 48 Гбайт оперативной памяти DDR3 PC3-10600 1333MHz, 2 жёстких диска HP SAS Enterprise 146 ГБ 15000 об./мин),
  • 4 дисковых полки расширения HP StorageWorks 2000 Modular Smart Array,
  • 48 жестких дисков HP 1TB 7200 об./мин,
  • сервер управления на базе HP DL360 G6 (Intel Xeon E5504, архитектура x86-64, тактовая частота 2.00 ГГц, 8 Гбайт оперативной памяти DDR3 PC3-10600 1333MHz, 2 жёстких диска HP SAS Enterprise 146 ГБ 10000 об./мин).

Файловый сервер

Собран на основе HP DL380 G6 и хранилища данных HP StorageWorks Modular Smart Array. Ёмкость системы составляет 27 Тбайт при использовании RAID5.

Комплектация:

Система резервного копирования

Ленточная библиотека HP MSL 4048 (стандарт LTO-4).

  • HP MSL 4048 поддерживает одновременную установку 48 картриджей, обеспечивающая скорость передачи данных не менее 576 Гбайт/час на два устройства считывания/записи, без учета сжатия.
  • поставлено 96 ленточных картриджей HP Ultrium 4 1.6TB RW Data Cartrige

Вычислительный комплекс на графических процессорах

Основан на 4-х Tesla S2070 1U установленных на сервере HP DL380 G6.

Комплектация:

  • 2 x Intel Xeon X5560 с тактовой частотой 2,8 ГГц,
  • 36 Гбайт оперативной памяти типа DDR3 Registered PC3-10600R 1333MHz,
  • 8 жестких дисков HP SAS Enterprise 300 Гб, 10000 об./мин.
  • 4 вычислительные системы NVIDIA Tesla S2070 PCIe x16 Gen2 (общие характеристики - 2060 GFlops; 24ГБ GDDR5).

Web-сервер

Основан на HP DL360 G6.

Комплектация:

Сервер баз данных №1

Основан на HP DL380 G6 с подключенным к нему дисковым массивом HP D2700 с объемом дискового пространства 3,6 Тбайт.

Комплектация:

  • 2 x Intel Xeon X5560 2,80 ГГц,
  • оперативная память 36Гбайт DDR3 Registered PC3-10600R 1333MHz,
  • 2 жёстких диска HP SAS Enterprise 146 ГБ, 10000 об./мин.
  • дисковая полка HP D2700 с установленными 25 дисками HP SAS Enterprise 146 ГБ, 15000 об./мин (возможность подключения 3-х дополнительных дисковых полок для увеличения общего числа дисков до 100).

Сервер баз данных №2

Основан на HP DL380 G6.

Комплектация:

Система бесперебойного питания

На основе модульного источника бесперебойного питания APC Symmetra PX (SY64K160H). Модульные панели распределения питания с автоматами для подключения оборудования.

Ноутбуки

Терминальный класс оснащенный ноутбуками HP Compaq 610 (VC275EA)

Физическое расположение, контакты ЦКП "Биоинформатика"

Высокопроизводительный кластер находится по адресу: ССКЦ СО РАН, пр. ак. Лаврентьева, д. 6, г. Новосибирск, 630090, Россия.

Доступ к кластеру nks-g6.sscc.ru разрешен только из подсетей Новосибирского научного центра СО РАН.

Вход на сервер разрешен только по ssh, переслать на сервер или с сервера данные можно только по scp или sftp.

Примеры shell-скриптов для запуска на кластере "Биоинформатика"

#!/bin/bash
#PBS -V
#PBS -q g6_q
#PBS -r n
#PBS -l nodes=2:ppn=4:mem=16GB,cput=20:00:00,walltime=21:00:00
#PBS -N appname
#PBS -j oe
date
cd $PBS_O_WORKDIR
cat $PBS_NODEFILE
pwd
mpirun -r ssh -genv I_MPI_FABRICS shm:ofa -n 8 ./mpiapplication param0 param1
date
#!/bin/bash
#PBS -V
#PBS -q g6_q
#PBS -r n
#PBS -l nodes=1:ppn=1:mem=2GB,cput=20:00:00,walltime=21:00:00
#PBS -N appname
#PBS -j oe
date
cd $PBS_O_WORKDIR
cat $PBS_NODEFILE
pwd
./application param0 param1
date



В рамках создания ЦКП "Биоинформатика" на базе ИЦиГ СО РАН образован коллектив экспертов научных программ для решения задач в области биоинформатики, сформулированы основные требования к устанавливаемому свободному программному обеспечению.

Область

Ответственный (ые) исполнитель (и)

Эволюционная биоинформатика

к.б.н. Гунбин К.В.

Популяционная генетика, сегрегационный анализ

к.б.н. Кириченко А.В., к.б.н. Гунбин К.В.

Регуломика

к.б.н. Ощепков Д.Ю.

Протеомика

к.б.н. Пинтус С.С., к.б.н. Иванисенко В.А.

Ассемблирование геномов

к.б.н. Вишневский О.В., к.б.н. Афонников Д.А.

Структурная биология

к.ф-м.н. Фомин Э.С., к.ф-м.н. Титов И.И.

Системная биология (моделирование динамики функционирования)

к.б.н. Лашин С.А., Казанцев Ф.В.

Статистический анализ данных

д.б.н. Ефимов В.М.

Системная биология (генные сети)

к.ф-м.н. Титов И.И., Тимонов В.С.

Выбор свободно-распространяемого программного обеспечения учитывает:
  • индекс научного цитирования программного продукта,
  • сведения о применимости программного продукта для анализа разного типа данных,
  • сведения о научной ценности программного продукта на современном этапе развития науки, исходя из экспертных оценок,
  • данные об уникальности алгоритмов реализованных в программном продукте,
  • возможность сборки исполняемых файлов программного продукта для архитектуры x86-64,
  • возможность построения конвейера анализа данных - универсальность входных и выходных форматов данных.

В рамках создания ЦКП "Биоинформатика" разработано решение по составу научных программ для решения задач в области биоинформатики, ориентированных на использование высокопроизводительных вычислений.

Bio-Linux 6.0

URL

Рекомендованные пакеты Bio Linux 6.0
act
ape
arb
artemis
assembly-conversion-tools
big-blast
biojava
blast+
bldp-files
blixem
cap3
cd-hit
clcsequenceviewer
cloudbl-desktop
clustal
coalesce
das-prep
dendroscope
dialign
dotter
dotur
dust
embassy-domainatrix
embassy-domalign
embassy-domsearch
embassy-phylip
emboss
emboss-data
emboss-doc
emboss-kmenus
emboss-lib
emboss-test
envbase-for-pedro
estscan
exchanger
fastDNAml
fasta
fasttree
fluctuate
forester
genespring-2
genquery
glimmer
glimmer3
grid-certs
handlebar
happy
hmmer
jalview
jemboss
jprofilegrid
keyring
lamarc
libajax6
libajax6-dev
libnucleus6
libnucleus6-dev
lucy
maxd
mcl
mesquite
migrate
mira
mira-3rd-party
mothur
mountapp
mrbayes
mrbayes-multi
msatfinder
mspcrunch
mummer
muscle
mview
ncbi-tools-x11
netblast
njplot
nrdb
ocount
oligoarray
oligoarrayaux
omegamap
paml
partigene
pedro
peptidemapper
pfaat
pftools
phylip
prank
priam
primer3
prot4est
qtlcart
rasmol
rbs-finder
readseq
recombine
sampledata
samtools
seaview
sequin
splitstree
squint
staden
stars
t-coffee
taverna
taxinspector
tetra
trace2dbest
transterm
transterm-hp
tree-puzzle
treeview
trnascan
usb-maker
wise2
xcut
yamap
zsh

Дополнительное свободное программное обеспечение, рекомендованное к установке в Linux-дистрибутив


Consan

URL

PROBCONS

URL

Kalign

URL

MAFFT

URL

Promals3D

URL

DaliLite

URL

Fast

URL

Mauve

URL

libGenome

URL

libMems

URL

libMuscle

URL

sgEvolver

URL

Boost

URL

R-COFFEE

URL

RNAlpfold

URL

RASCAL

URL

LEON

URL

LINTREE

URL

ModelGenerator

URL

GARLI

URL

PATHd8

URL

BEAST

URL

BIONJ

URL

QuickTree

URL

WEIGHBOR

URL

PROTTEST

URL

jModeltest

URL

MrAIC.pl

URL

CONSEL

URL

Bio++ Program Suite

URL

Bio++ C++ libraries

URL

RAxML

URL

PhyloBayes

URL

PhyML

URL

PhyML-MPI

URL

PhyML-CAT

URL

PhyML-mixture

URL

PhyML-structure

URL

nhPhyML

URL

PhyMLrates

URL

r8s

URL

SEMPHY

URL

HyPhy

URL

DDE

URL

KaKs_Calculator

URL

EvoRadical

URL

AsymmetryCounter & AsymmetryScaler

URL

Crann

URL

ADAPTSITE

URL

KrKc.pl

URL

MODELESTIMATOR

URL

MK-Test

URL

Rate4Site

URL

Selecton Server

URL

PAML

URL

GASP

URL

Ortheus

URL

FASTML server

URL

ANCESCON

URL

INDELible

URL

SimWalk2

URL

Solar

URL

Merlin

URL

MIGRATE-N

URL

Lamarc

URL

HKA

URL

FPG

URL

IM & IMa

URL

Genepop

URL

UNAFold

URL

FUGUE

URL

BioCocoa

URL

tRNAscan-SE

URL

PeakSeq

URL

Hpeak

URL

SOLiDT (CoronaLite)

URL

ERANGE

URL

GeneTrack

URL

FindPeaks

URL

SISSRs

URL

QuEST

URL

MACS

URL

CisGenome

URL

AMOS

URL

CABOG

URL

WGS-assembler

URL

The Arachne assembler

URL

Phred/Phrap/ConsEd

URL

EDENA

URL

Forge

URL

QSRA

URL

SeqCons

URL

SHARCGS

URL

SHORTY

URL

SR-ASM

URL

Taipan

URL

SSAKE

URL

VCAKE

URL

Velvet

URL

NAMD

URL

GROMACS

URL

MOPAC

URL

GAMESS

URL

TINKER

URL

Blat

URL

Blast

URL

R

URL

Python

URL

BioPython

URL

NumPy & SciPy

URL

BioPerl

URL

BioJava

URL

BioC++

URL

Objective Caml

URL

Octave

URL



Работа поддержана Междисциплинарным проектом "Создание программной среды для институтов СО РАН на базе свободно-распространяемого ПО и программного обеспечения с открытым исходным кодом в качестве составной части национальной программной платформы"

© All Copyright Reserved by Nikolay L. Podkolodny, Konstantin V. Gunbin and Nikolay A. Kolchanov

Page last modified on