Ano ang Isang SRE?

Site reliability engineering

Panimula:

Ang site reliability engineering (SRE) ay isang disiplina na pinagsasama software at system engineering upang matiyak ang pagkakaroon, pagganap, at pagiging maaasahan ng mga web application. Kabilang dito ang mga proseso tulad ng paggawa ng mga alerting system, pagsubaybay sa kalusugan ng system, pag-automate ng mga gawain sa pagpapatakbo at pag-troubleshoot ng mga isyu.

 

Ang tungkulin ng isang SRE:

Ang trabaho ng SRE ay pamahalaan ang pagiging kumplikado na nauugnay sa pagpapatakbo ng malalaking serbisyo sa web sa pamamagitan ng pagbabawas ng panganib at pagpapabuti ng oras ng system. Maaaring kabilang dito ang pagse-set up ng mga proseso para sa paglutas ng insidente, pag-automate ng mga gawain, proactive na pagsubaybay para sa mga potensyal na isyu bago mangyari ang mga ito at patuloy na pagpapabuti ng kalidad ng serbisyo. Upang magawa ito nang epektibo, ang isang SRE ay kailangang magkaroon ng parehong teknikal na kadalubhasaan sa pinagbabatayan ng mga teknolohiyang nagpapagana sa kanilang mga serbisyo pati na rin ang malalim na pag-unawa sa mga layunin ng negosyo na sinusubukang makamit ng kanilang mga serbisyo.

 

Benepisyo:

Pinagtibay ang SRE pinakamahusay na kasanayan maaaring magkaroon ng maraming pakinabang para sa mga organisasyon, kabilang ang pinahusay na pagiging maaasahan ng serbisyo at mas mahusay na kasiyahan ng customer. Sa pamamagitan ng automation ng mga proseso tulad ng provisioning at deployment, matitiyak ng mga SRE team ang mas mabilis na time-to-market na humahantong sa isang competitive na kalamangan sa iba pang mga kumpanya sa merkado. Bukod pa rito, binibigyang-daan nila ang mga organisasyon na bawasan ang mga gastos sa pagpapatakbo sa pamamagitan ng pagliit ng mga manu-manong operasyon at pagtaas ng oras ng system.

 

Magkano ang Gastos Upang Pamahalaan ang Isang SRE Team?

Ang halaga ng pamamahala sa isang pangkat ng SRE ay maaaring mag-iba depende sa iba't ibang mga kadahilanan tulad ng bilang ng mga mapagkukunang kailangan, antas ng kanilang karanasan at ang pagiging kumplikado ng mga serbisyong pinamamahalaan. Sa pangkalahatan, ang mga organisasyon ay dapat magplano para sa mga gastos na nauugnay sa pagkuha at pagsasanay ng mga tauhan, namumuhunan sa mga kasangkapan upang subaybayan ang mga sistema, at iba pang mga kaugnay na gastos. Bukod pa rito, ang mga organisasyon ay dapat isaalang-alang ang mga potensyal na matitipid mula sa pinahusay na pagiging maaasahan ng serbisyo na nagmumula sa pamamahala ng isang SRE team sa paglipas ng panahon.

 

Paghihinuha:

Sa konklusyon, ang SRE ay isang disiplina na pinagsasama ang mga prinsipyo mula sa software engineering at systems engineering na may layuning tiyakin ang pagkakaroon, pagganap, at pagiging maaasahan ng mga web application. Kabilang dito ang mga proseso tulad ng paggawa ng mga alerting system, pagsubaybay sa kalusugan ng system, pag-automate ng mga gawain sa pagpapatakbo at pag-troubleshoot ng mga isyu. Gaya ng nakita natin, ang pag-aampon ng pinakamahuhusay na kagawian sa SRE ay maaaring magdala ng maraming pakinabang tulad ng pinahusay na pagiging maaasahan at mas mabilis na time-to-market na humahantong sa isang competitive na kalamangan. Bilang resulta, parami nang parami ang mga kumpanya na ngayon ay nagsasama ng mga prinsipyo ng SRE sa kanilang mga operasyon.