+1 (208) 254-6996 [email protected]

  Figure 2. Normal distribution of a bell curve.  However, when moving from parameters to  statistics, there is the probability that the  results will not reflect the population, and  thus not be normally distributed. Measures  of Central Tendency provide you with  information about how your results are  grouped. There are three measures, and  which one to use depends on what level of  measurement the variable is.    Mean (represented by M or μ) is the most  commonly referred to measure of central  tendency.  It is the average measure, where  each value is added, and then the sum  divided by the number of cases.  However,  it should be quite clear that the mean cannot  be used with nominal and ordinal variables.   Imagine again a Likert scale.  The mean  value might be 2.36, but what does that tell  you?  That the average respondent falls  somewhere closer to “I found this difficult”  than “I have no opinion”?    Median (represented by Mdn) is the measure  commonly used with ordinal data.  The  median is the halfway point of the data. To  calculate simply order your values from  lowest to highest and see at what value half  the data is below, and half is above.  The  median is also an extremely valuable  measure for ratio data when there are  outliers (think how the average income  variable would be skewed in a town with  one multimillionaire).  This is because  median is not affected by how far away  from the middle values are, just the quantity

of them.  The median for 2, 2, 3, 4, 4 is 3; the  median for 2, 2, 3, 4, 10 is also 3.      Mode is often used with nominal data  (though it can also be calculated for other  variable types).  It is simply the most  frequently occurring value in a dataset.  An  example of when this would be an  appropriate measure is for major.  The  average major makes no sense, nor does the  halfway point major, but the most  frequently occurring major does.    Measures of Spread  Measures of central tendency reveal much  about data, but not the whole story.  You  also need to know how the values are  spread across the spectrum.  Measures of  spread will tell us whether the values are  clustered around the mean or more spread  out.  Think of test scores; one group might  all score 70, while another group’s score  might range from 60‐90.  In this case, it is  possible that the mean, median and mode  would be the same, but we can see the  distribution is quite different. There are  three main statistical methods for  determining spread.    Range is the most basic measure; it is  calculated simply by subtracting the lowest  score from the highest score.  However, this  is not the most accurate method as the range  can be skewed by outlier values (a very high  or very low score).

Don't use plagiarized sources. Get Your Custom Essay on
. Normal distribution of a bell curve. However, when moving from parameters to statistics, there is the probability that the
Just from $13/Page
Order Essay



Evidence Based Library and Information Practice 2007, 2:1


Interquartile range is less likely to be  distorted by outliers, as it is calculated by  ordering the sample from highest to lowest,  then dividing the sample into four equal  quarters (percentiles). The median is then  calculated for each quartile.  Subtracting the  median of the first quartile from the third  quartile obtains the interquartile range.    Standard deviation (represented by SD or σ)  is the most sophisticated measure of spread,  and a widely used statistical concept.

Statistical software will easily calculate  standard deviation, so the formula will not   be covered here.  Because standard   deviation relies on calculations of the mean  it can only be used with continuous  variables.  A standard deviation score of 0  indicates that there is no variation of values.  The higher the standard deviation, the  larger the spread.   Bivariate Analysis  At heart of all research is an interest in  determining relationships between variables.

Table 4. An example of measures of central tendency and measures of spread.

Characteristics of the variable AGE

Age of Respondent    N



Mean    44.05  Median    43  Mode    33  Std Deviation    12.77  Range    38  Percentiles  25  33    50  43    75  56.50

What does this tell us about the central tendencies of the data?  The average age of librarian respondent to this survey is 44.05.  Half of the librarians were  over 43, while other half were under 43.  The most commonly occurring age was 33.      What does this tell about the spread of the data?  We can tell something about spread simply by looking at the difference between mean,  median and mode.  The fact that the mean is slightly higher than the median and much higher  than the mode indicates that there are some older respondents skewing the data.     The range indicates that there are 38 years between oldest and youngest respondent. This  large value could be due to the outliers at the upper end of the scale.  However, the large  standard deviation also indicates a wide spread of values.  This is not surprising, as logically  in any profession, there is likely to be a wide variety of ages.



Evidence Based Library and Information Practice 2007, 2:1


There are many statistical methods for  exploring those relationships, which ones to  choose are often dependent on the type of  variables with which you are working  (nominal, ordinal or ratio). It is also  important to understand statistical  significance (the extent to which the  relationship can be generalized to the  population) and effect size (the strength of  the relationship) with bivariate analysis  techniques.    Statistical Significance     Comprehending inferential statistics  requires a clear understanding of what is  meant by statistical significance.  For  something to be statistically significant, it is  unlikely to have occurred by chance  (remember that every time you are dealing  with a sample you are taking the chance that  your results will not reflect the population).  Another way of putting it is that significance  tests denote how large the possibility is that  you are committing a Type I error.   Significance tests are affected by the  strength of relationship between variables  and the size of the sample. Common levels  of significance (represented by alpha, or α)  are 5%, 1% and 0.1%; if α =.01, you are  stating that there is a one in one thousand  chance this happened by coincidence.      Cross Tabulation  What is a cross tabulation?  Essentially a cross tabulation (cross tab) is a  table in which each cell represents a unique  combination of values.  This allows you to  visually analyze whether one variable’s  distribution is contingent on another’s.    When would you use a cross tabulation?  Cross tabulations can be used to show  relationships between two nominal  variables, nominal and ordinal variables, or  two ordinal variables.  It can be used with

ratio data, as long as the variable has a  limited number of values. Limitations of the  cross tabulation  Cross tabulations provide you with a visual  view of comparative data, but because they  display simple values and percentages,  there is no way to gauge whether any  differences in the distribution are  statistically significant.    Chi‐Square  What is a chi‐square?  A chi‐square is a test which looks at each  cell in a cross tabulation and measures the  difference between what was observed and  what would be expected in the general  population. It is used to evaluate whether  there is a relationship between the values in  the rows and columns of a cross tab, and the  likeliness that any differences can be put  down to chance.     When would you use a chi‐square?  Chi‐square is one of the most important  statistics when you are assessing the  relationship between ordinal and/or  nominal measures.    Are there limitations of using chi‐square?  Chi‐square cannot be used if any cell has an  expected frequency of zero, or a negative  integer.  It can be affected by low  frequencies in cells; if many of your cells  have a frequency of less than 5, the chi‐ square test might be compromised.    How do I know if the relationship is  statistically significant?  The chi‐square test provides a significance  value called a p‐value. The p‐value is  compared to α, which can be set at different  levels. If α = .05, then a p score less than .05  indicates statistical significant differences, a  p score greater than .05 means that there is  no statistical difference.



Evidence Based Library and Information Practice 2007, 2:1



Table 5. Example of cross tabulation.        T‐test  What is a t‐test?  A t‐test compares the means between two  values. It tests whether any differences in  the means are statistically significant or can  be explained by chance.    When do you use a t‐test?  T‐tests are normally used when comparing  differences between two groups (i.e.,  undergraduates versus graduates) or in a  before and after situation (student  achievement before versus after library

instruction). A t‐test involves means,  therefore the dependent variable (the  variable you are attempting to measure)  must be a ratio variable.  The independent  variable is nominal or ordinal.    Limitations of the t‐test  A t‐test can only be used to analyze the  means of two groups. For more than two  groups, use ANOVA.      How do I know if the relationship is  statistically significant?

Cross tabulation of type of library and I have heard the

term evidence‐based practice

Yes  No  Total  Academic Library           Count  30  12  42     Percentage  71.42%  28.58%  100%  Public Library           Count  54  30  84     Percentage  64.28%  35.72%  100%  School Library           Count  9  12  21     Percentage  42.86%  57.14%  100%  Special Library           Count  22  10  31     Percentage  70.96%  29.04%  100%  Other/Not Stated           Count  20  11  31     Percentage  64.51%  35.49%  100%  Total Count  100  110  210

What does this table tell us?  This table allows us to see the numbers of librarians who have heard of the term Evidence‐ based Practice broken down by type of library worked at. As you can see, there are some  differences between the groups; a smaller percentage of school librarians have heard of EBP  (42.86%, N = 9) than other type of librarians. There is no indication from this table, however, if  that difference is statistically significant.

Order your essay today and save 10% with the discount code ESSAYHELP