Производителност на системи за съхранение на дискови масиви при връзка с един хост

Като цяло дискът или дисковите масиви имат най-добрата производителност в сценарий за връзка с един хост. Повечето операционни системи са базирани на изключителни файлови системи, което означава, че файлова система може да бъде собственост само на една операционна система. В резултат както операционната система, така и приложният софтуер оптимизират четенето и записването на данни за дисковата система за съхранение въз основа на нейните характеристики. Тази оптимизация има за цел да намали времето за физическо търсене и времето за механична реакция на диска. Заявките за данни от всеки програмен процес се обработват от операционната система, което води до оптимизирани и подредени заявки за четене и запис на данни за диска или дисковия масив. Това води до най-добра производителност на системата за съхранение в тази настройка.

За дискови масиви, въпреки че между операционната система и отделните дискови устройства е добавен допълнителен RAID контролер, настоящите RAID контролери основно управляват и проверяват операциите за устойчивост на грешки на диска. Те не извършват обединяване, пренареждане или оптимизиране на заявки за данни. RAID контролерите са проектирани въз основа на предположението, че заявките за данни идват от един хост, вече оптимизиран и сортиран от операционната система. Кешът на контролера осигурява само директни и изчислителни възможности за буфериране, без да поставя данни в опашка за оптимизиране. Когато кешът се запълни бързо, скоростта незабавно намалява до действителната скорост на дисковите операции.

Основната функция на RAID контролера е да създаде един или повече големи дискове, устойчиви на грешки, от множество дискове и да подобри общата скорост на четене и запис на данни, като използва функцията за кеширане на всеки диск. Кешът за четене на RAID контролерите значително подобрява производителността на четене на дисковия масив, когато същите данни се четат за кратко време. Действителната максимална скорост на четене и запис на целия дисков масив е ограничена от най-ниската стойност сред честотната лента на канала на хоста, изчислението на контролера за проверка и възможностите за контрол на системата (RAID двигател), честотната лента на дисковия канал и производителността на диска (комбинираната действителна производителност на всички дискове). Освен това несъответствието между основата за оптимизация на заявките за данни на операционната система и RAID формата, като например размерът на блока на I/O заявките, който не съответства на размера на RAID сегмента, може значително да повлияе на производителността на дисковия масив.

Варианти на производителността на традиционните системи за съхранение на дискови масиви при достъп с множество хостове

При сценарии за достъп до множество хостове производителността на дисковите масиви намалява в сравнение с връзките с един хост. В дребномащабни системи за съхранение на дискови масиви, които обикновено имат единична или излишна двойка контролери на дискови масиви и ограничен брой свързани дискове, производителността се влияе от неподредените потоци от данни от различни хостове. Това води до увеличени времена за търсене на диска, заглавна и крайна информация за сегмент от данни и фрагментиране на данни за четене, сливане, изчисления за проверка и процеси на пренаписване. Следователно производителността на хранилището намалява, когато повече хостове са свързани.

При системи за съхранение с големи дискови масиви влошаването на производителността е различно от това на малките дискови масиви. Тези широкомащабни системи използват шинна структура или кръстосана комутационна структура за свързване на множество подсистеми за съхранение (дискови масиви) и включват кешове с голям капацитет и модули за свързване на хостове (подобно на канални хъбове или комутатори) за повече хостове в рамките на шината или комутацията структура. Производителността до голяма степен зависи от кеша в приложенията за обработка на транзакции, но има ограничена ефективност в сценарии с мултимедийни данни. Докато подсистемите на вътрешния дисков масив в тези широкомащабни системи работят относително независимо, една логическа единица е изградена само в една дискова подсистема. По този начин производителността на отделна логическа единица остава ниска.

В заключение, малките дискови масиви изпитват спад в производителността поради неподредени потоци от данни, докато големите дискови масиви с множество независими дискови масиви подсистеми могат да поддържат повече хостове, но все още са изправени пред ограничения за мултимедийни приложения за данни. От друга страна, NAS системите за съхранение, базирани на традиционната RAID технология и използващи NFS и CIFS протоколи за споделяне на съхранение с външни потребители чрез Ethernet връзки, изпитват по-малко влошаване на производителността в среди с множество хост достъп. NAS системите за съхранение оптимизират предаването на данни, използвайки множество паралелни TCP/IP трансфери, позволявайки максимална споделена скорост от около 60 MB/s в единична NAS система за съхранение. Използването на Ethernet връзки позволява данните да се записват оптимално в дисковата система след управление и пренареждане от операционната система или софтуера за управление на данни в тънкия сървър. Следователно самата дискова система не изпитва значително влошаване на производителността, което прави NAS хранилището подходящо за приложения, изискващи споделяне на данни.


Време на публикуване: 17 юли 2023 г