Quando si parla di framerate (cui ci si può riferire anche con la locuzione frame frequency) ci si riferisce alla frequenza (rate in inglese) con la quale un dispositivo è in grado di riprodurre immagini singole e consecutive chiamate frame. Il termine si applica a diversi settori: cinematografico (sia dal punto di vista delle riprese sia dal punto di vista della proiezione), della computer grafica e dei sistemi motion capture. Il frame rate, spesso e volentieri, viene espresso tramite il valore frame per second (abbreviato in FPS, frame al secondo), una sorta di unità di misura che indica il numero di immagini singole consecutive (i frame) che un dispositivo è in grado di riprendere o riprodurre nell’arco di un singolo secondo.
Il background anatomico
L'occhio umano e la sua interfaccia neurale – il sistema visivo – è in grado di processare dalle 10 alle 12 immagini singole al secondo. Molto, però, dipende dalla situazione che ci si trova ad osservare: la soglia varia a seconda dello stimolo visivo che colpisce il nervo ottico. Se, ad esempio, ci si trova di fronte a uno schermo illuminato, un frame di colore nero (schermo spento) può essere percepito dal sistema nervoso se dura almeno 16 millisecondi. Un osservatore, inoltre, può richiamare alla mente un'immagine specifica all’interno di un'ininterrotta serie di immagini differenti solo se ognuna di esse è rimasta visibile per almeno 13 millisecondi.
Un singolo stimolo della durata di appena 1 millisecondo (uno stimolo visivo brevissimo non preceduto o seguito da altri stimoli, come ad esempio una brevissima immagine illuminata preceduta e seguita da uno schermo nero), invece, resterà impresso nella mente dell'utente per un lasso di tempo che va dai 100 ai 400 millisecondi: la causa è da ricercarsi in quella che è definita persistenza della visione nella corteccia cerebrale che si occupa di analizzare i dati in arrivo dal nervo ottico. Questo fenomeno è alla base dell'animazione: la persistenza della visione, infatti, può portare all'illusione della continuità, facendo credere all'osservatore che una serie ininterrotta di immagini ferme siano invece in movimento.
Agli albori del cinema
I primi film muti avevano un framerate variabile tra i 16 e i 24 FPS, ma, dal momento che le prime cineprese erano controllate manualmente (l'operatore azionava “a mano” una manovella che permetteva alla pellicola di scorrere, impressionando in questo modo i vari fotogrammi), la frequenza può variare di caso in caso e addirittura, all’interno di uno stesso film, da momento a momento (a seconda di quanto era stanco l’operatore addetto a girare la manovella). Capitava spesso, poi, che le immagini fossero trasmesse nelle sale cinematografiche con un framerate maggiore, dando così l'impressione di un movimento strano e poco “umano” (come ad esempio le comiche mute “superveloci” di inizio ‘900).
Una sorta di standardizzazione si raggiunge nel 1926 con l'introduzione del sonoro: l'orecchio umano ha una maggiore sensibilità rispetto all'occhio alle variazioni di frequenza e velocità nel parlato (si pensi agli effetti distorsivi percepiti dall’orecchio nel caso di una sirena in avvicinamento o in allontanamento). Per questo si rese necessario adottare un framerate standard per tutte le riprese cinematografiche: tra il 1927 e il 1930, a seguito di alcuni aggiornamenti tecnologici, le registrazioni audio-video avvengono a 24 frame per second. Si tratta, tutt'oggi, dello standard utilizzato nelle maggiori produzioni televisive e cinematografiche.
Scansione interlacciata e scansione progressiva
Per creare un singolo frame (o una sequenza di frame) su di uno schermo è possibile utilizzare due differenti tecniche: la scansione interlacciata delle immagini o la scansione progressiva.
Nel primo caso l'area visibile del televisore o del monitor (il quadro dello schermo) è scomposta in due semiquadri attivati in maniera alternata. Un semiquadro è composto dalle sole righe pari dello schermo mentre l’altro è formato dalle sole righe dispari. Il framerate, in questo caso, è dato dalla frequenza di accensione e spegnimento delle righe pari e delle righe dispari (ovvero l’accendersi e lo spegnersi dei sue semiquadri). Perché tutto funzioni a dovere, anche le immagini da visualizzare sono divise in righe pari e righe dispari e ricomposte a schermo grazie alla rapida alternanza accensione/spegnimento dei vari semiquadri. Nei due standard televisivi principali – PAL e NTSC – la frequenza di interlacciamento è rispettivamente di 50 e 60 framerate: ciò vuol dire che le linee pari e le linee dispari si accendono e spengono per 50 e 60 volte ogni secondo (un quadro completo, quindi, viene tracciato rispettivamente 25 e 30 volte al secondo).
Nel caso della scansione progressiva, invece, le immagini non sono scomposte in righe, ma trattate come un unico insieme di informazioni e visualizzate nel loro complesso senza alcuna alternanza. Le immagini vengono riprese e poi visualizzate una dopo l’altra in rapida successione, progressivamente, e da qui il nome di questa tecnica. Tutto ciò permette di ottenere immagini più nitide e stabili rispetto alla scansione interlacciata, anche utilizzando framerate minori.
Il vantaggio principale nell’utilizzare una scansione interlacciata in luogo di una progressiva (che, come abbiamo detto, ha una resa decisamente superiore) sta nel fondamentale risparmio di banda (quantità di informazioni da inviare, nell’etere o via cavo, nell’unità di tempo): un video in scansione interlacciata permette di dimezzare le necessità di larghezza banda rispetto alla sua controparte progressiva.
La classificazione
L'evoluzione tecnologica e cinematografica ha portato all'affermazione di tre framerate standard, da utilizzare a seconda del mezzo utilizzato per la trasmissione : 24p, 25p e 30p. Esistono, comunque, moltissime altre varianti così come nuovi standard emergenti.
● 24p. Formato a scansione progressiva con frequenza da 24 FPS, trova applicazione in moltissimi settori grazie alla sua duttilità. Standard di fatto del mondo cinematografico (film di animazione compresi), è conseguentemente utilizzato anche nel mondo televisivo e nell'universo delle riprese video in genere. Nel caso di trasmissione televisiva, però, c’è bisogno di qualche adattamento: sia il PAL sia lo NTSC, infatti, hanno framerate differenti derivanti dalla loro natura di formati a scansione interlacciata. Per lo standard NTSC il frame rate è rallentato a 23,976 FPS (o, per essere più precisi, 24x1000/1001 frame per second per garantire una maggiore compatibilità con il framerate interlacciato di 60 semiquadri al secondo); nel caso di trasmissione con standard PAL o SECAM il frame rate è velocizzato a 25 FPS (in quanto la frequenza interlacciata, in questo caso, è di 50 semiquadri)
● 25p. Formato a scansione progressiva che nasce dalla frequenza di aggiornamento della corrente a fase alternata - 50 Hertz - utilizzata in Europa, Asia e Africa. Ciò ha portato i primi produttorri televisivi europei a realizzare televisori basati su un formato interlacciato - il PAL - con frequenza di aggiornamento di 50 semiquadri al secondo. Nel momento in cui si è passati dal formato a scansione interlacciata al formato a scansione progressiva si è ridotta la frequenza di aggiornamento, portandola a 25 FPS, o 25p
● 30p. Formato a scansione progressiva, produce video a 30 frame per second. Pur mantenendo l'aspetto delle riprese cinematografiche (24p) consente di ridurre lo sfarfallio tra due frame: le riprese risultanti sono dunque più realistiche e più stabili
● 48p. Formato a scansione progressiva, è in fase di test nell'industria cinematografica per rimpiazzare l'ormai datato standard a 24 FPS. Riduce la sfocatura movimento (motion blur in inglese) tipica delle riprese a 24 frame al secondo, dando l'impressione di immagini più vivide e reali. Utilizzato da Peter Jackson per le riprese del film “Lo Hobbit: un viaggio inaspettato”, ha avuto reazioni contrastanti tra il pubblico: in alcuni casi gli spettatori hanno ritenuto le immagine sin troppo realistiche, facendo cadere quella sorta di velo di Maya che aiuta a distinguere tra vita reale e finzione filmica
● 50/60p. Pur non essendo incluse negli standard di trasmissione televisiva oggi in uso, i formati 50p e 60p (entrambi progressivi) sono utilizzati dai televisori HD di fascia alta. Per questo si ritiene che, nell'arco di pochi anni, le riprese televisive saranno tutte realizzate nel formato 50p o 60p
● 90p. Formato a scansione progressiva, è utilizzato da visori a realtà aumentata come l'HTC Vive e l'Oculus Rift. Il perché è presto detto: i 90 frame per second sono suddivisi esattamente a metà tra i due display che compongono il campo visivo del visore a realtà aumentata (45 FPS per il display sinistro, 45 FPS per il display destro) e, come visto anche nei casi precedenti (ad esempio il formato 48p), una frequenza di aggiornamento più alta permette di ridurre il cosiddetto “effetto mosso” (il motion blur), evitando così che i visori a VR abbiano effetti indesiderati di varia natura (come ad esempio nausea o disorientamento)
● 100/120p. Formati standard progressivi, sono inseriti nelle raccomandazioni tecnologiche per la produzione di filmati in Ultra Alta Definizione. Le ultime versioni della videocamera GoPro (3, 3+ e 4), ad esempio, sono in grado di riprendere a 120 FPS, mentre sono sempre più comuni monitor e televisori con un refresh rate di 120 Hertz e capaci, dunque, di riprodurre filmati girati con questo standard
● 144/240p. Anche se ancora molto costosi e poco diffusi, diversi monitor, pensati e realizzati soprattutto per gaming computer, supportano un framerate di 144 o addirittura 240 FPS, assicurando, in questo modo, un’esperienza di gioco assolutamente fluida ed una resa delle immagini iperrealistica
Quale FPS scegliere
Dalla descrizione appena fatta appare scontato che, nel momento in cui si dovesse essere chiamati a scegliere tra due modelli di televisori, monitor per computer o fotocamere digitali, si dovrebbe prediligere, compatibilmente con il budget a disposizione, il modello con il framerate maggiore. Capirne il perché è tutt’altro che complesso: una frequenza di aggiornamento più alta permette, come già accennato, di avere immagini più definite e stabili; di ridurre lo sfarfallio dovuto al movimento (il motion blur) e ottenere, in questo modo, sequenze video più realistiche e coinvolgenti.